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内 容 提 要 


调试 对 于 软件 的 成 败 至 关 重 要 ， 正 确 使 用 恰当 的 调试 工具 可 以 提高 发 现 和 改正 错误 的 效率 。 本 书 详 
细 介 绍 了 3 种 调试 希 ，GDB 用 于 逐 行 跟踪 程序 、 设 置 断 点 、 检 查 变 量 以 及 查看 特定 时 间 程 序 的 执行 情况 ， 
DDD 是 流行 的 GDB 的 GUI Him, Mi Eclipse 提供 完整 的 集成 开发 环境 。 书 中 不 但 配合 实例 讨论 了 如 何 管 
理 内 存 、 理 解 转 储 内 存 、 跟 踩 程序 找 出 错误 等 内 容 ， 更 洱 善 了 其 他 同类 书包 略 的 主题 ， 例 如 线程 、 客 户 / 
HRS 4. GUI 和 并 行程 序 ， 以 及 如 何 躲 开 稼 匈 的 调试 陷阱 。 

本 书 适 合 各 层次 软件 开发 人 员 、 管 理 人 员 和 测试 人 员 阅 读 。 
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“WE, AA!” RIIE Andrew Er RUA EIER] VAN LH JG ee. Andrew = FHE 
大 一 上 编程 诬 时 就 学 过 了 调试 工 上 其 , 不 过 那 时 他 只 是 将 调试 工具 当做 应 付 期 末 考 试 的 内 容 来 打发 
的 。 现 在 他 已 经 大 四 了 了， 教授 强烈 要 求 他 停止 采用 输出 语句 进行 调试 的 方法 ， 改 为 使 用 正式 调试 
工具 。 让 Andrew 豆 出 望 外 的 是 ， 他 发 现 使 用 恰当 的 工具 可 以 大 大 缩短 调试 时 间 。 

如 今 ， 在 学 生 及 已 参加 工作 的 程序 员 中 ,还 有 不 少 “Andrew” 但 愿 本 书 能 帮助 “Andrew 们 ” 
发 现 调试 工具 的 好 人 处。 但 是 ， 我 们 更 希望 本 书 能 帮助 那些 已 经 使 用 了 调试 工具 ， 但 还 无 法 确定 在 
什么 情况 下 访 做 什么 事 的 程序 员 做 出 适当 的 判断 。 本 书 也 适用 于 打算 进一步 学 习 调试 工具 及 其 幕 
后 原理 的 人 。 

本 书 的 编辑 曾 说 过 ,很 多 调试 知识 以 前 都 只 是 在 财 子 里 口 口 相 传 , 没有 正式 编 车 成 书 。 本 书 
将 改变 这 一 状况 。 本 书 回答 了 下 列 问题 。 

a 如 何 调试 线程 代码 ? 

O 为 什么 有 时 候 断 点 最 终 出 现 的 位 置 与 原来 设置 的 位 置 略 有 俩 甜 ? 

口 GDB 的 until 命 令 为 什么 有 时 会 跳 到 意 想 不 到 的 地 方 ? 

a 如 何 巧 妙 使 用 DDD 和 Eclipse? 

O 在 当今 普遍 使 用 GUI 的 时 代 ， 像 GDB 这 样 的 基于 文本 的 应 用 程序 还 有 价值 吗 ? 

a 为 什么 当 错误 代码 超出 数组 边界 时 不 发 生 段 错误 ? 

a 为 什么 要 将 我 们 的 一 个 示例 数据 结构 命名 为 nsp? 《〈 不 好 和 意思， 这 只 是 与 我 们 的 出 版 商 No 

Starch Press 私 下 开 的 一 个 玩 突 。) 

本 书 既 没有 美 其 名 日 “用 户 手 册 ” 也 不 是 关于 调试 过 程 认 知 理论 的 抽象 论文 。 本 书 有 点 介 
于 这 两 者 之 间 。 一 方面 ， 人 确实 提供 了 如 何 操作 GDB、DDD 和 和 Eclipse 中 特定 命令 的 信息 ; 为 一 方 
面 ， 讲 解 并 频繁 使 用 了 关于 调试 过 程 的 一 些 通 用 原则 。 

我 们 之 所 以 选择 GDB、DDD 和 Eclipse， 古 因为 它们 在 Linux/ 开 源 社 区 中 比较 流行 。 本 书 的 示 
例 有 点 依 问 于 GDB， 不 仅仅 因为 GDB 基 于 文本 的 性 质 使 得 显示 在 一 个 页 面 中 更 紧凑 ， 而 且 正 如 
上 面 的 问题 所 上 暗示 的 ， 我 们 发 现 基于 文本 的 命令 在 调试 过 程 中 仍然 起 看 举足轻重 的 作用 。 

Eclipse 的 用 途 越 来 越 广泛 ， 其 远 不 止 仅 作 为 我 们 这 里 的 调试 角色 ， 还 提供 了 各 种 有 吸引 力 的 
调试 工具 。 男 一 方 和 面 ，DDD 占 用 空间 小 ， 而 且 包 括 了 Eclipse 中 不 具备 的 某 些 强大 功能 。 

第 1 章 是 概览 。 很 多 经 验 丰富 的 程序 员 可 能 想 跳 过 这 一 章 ， 但 是 我 们 强烈 建议 大 家 通读 一 通 ， 
因为 这 一 和 章 列 出 了 我 们 针对 调试 过 程 推荐 的 一 些 徐 单 却 有 用 的 通用 准则。 
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BRA ENA Y Mili d n] 2b EIS AN AE Wet, We SRR Aan, GARE, 
删除 和 共用 断 点 ， 从 一 个 断 点 移 a 到 男 一 个 断 点 ， 查 看 关于 靳 点 的 详细 信息 ， 等 等 。 

到 达 断 点 后 会 出 现 什么 情况 呢 ? 第 3 草 回 答 了 这 一 问题 。 我 们 这 里 采用 的 示例 涉及 过 历 树 的 
代 但 ， 重 点 是 介绍 当 到 达 断 点 时 如 何方 便 地 显示 树 中 节点 的 内 容 。 这 里 GDB 相 当 出 色 ， 提 供 了 一 
些 非 常 灵 活 的 功能 ， 有 助 于 在 每 次 程序 暂停 时 有 效 地 显示 感 兴趣 的 信息 。 这 一 章 还 提供 了 一 个 特 
别 优 秀 的 用 网 形 显 示 树 和 其 他 链接 数据 结构 的 DDD 功 能 。 

第 4 草包 括 了 由 于 段 错误 而 产生 的 致命 运行 时 错误 。 我 们 首先 介绍 了 央 溪 时 在 底层 发 生 了 什 
AH, 包括 程序 的 内 存 分 配 以 及 硬件 与 操作 系统 的 协同 作用 。 对 系统 知识 比较 了 解 的 谈 者 可 能 会 
跳 过 这 一 章 ， 但 是 我 们 相信 ， 其 他 很 多 恋 者 会 得 益 于 这 一 草 介 绍 的 基础 知识 。 然 后 介绍 了 核心 文 
件 ， 包 括 如 何 创建 核心 文件 ， 如 何 使 用 它们 来 完成 “事后 反思 ”。 最 后 介绍 了 关于 调试 会 话 的 一 
个 扩展 示例 ， 其 中 有 几 个 程序 错误 产生 了 段 错误 。 

第 $ 草 不 但 介绍 并 行 编程 ， 而 且 包 括 网 络 代 码 。 客 户 / 服 务 喜 网 络 编程 可 算 作 并 行 处 理 ， 甚 至 
我 们 的 工具 也 是 并 行使 用 的 。 比 如 ， 在 两 个 窗口 中 使 用 GDB， 一 个 窗口 用 于 客户 机 ， 另 一 个 窗口 
用 于 服务 右 。 由 于 网 络 代 人 码 涉及 系统 调用 ， 因 此 我 们 用 C/C++ 的 errno 变 量 和 Linux 的 strace 命 令 
补充 我 们 的 调试 工具 。5.2 市 涉及 线程 编程 。 这 里 同样 肯 先 概述 基本 内 容 : 分 时 、 进 程 与 线程 、 
苑 争 条 件 等 。 这 一 半 介 绍 了 在 GDB、DDD 和 Eclipse 中 使 用 线程 的 拉 术 细节 ， 并 再 次 讨论 了 一 些 
要 记 住 的 通用 原则 ， 比 如 友 生 线程 上 下 文 切换 时 的 时 间 选 择 随机 性 。5.4 节 介绍 了 用 流行 的 MPI 
和 OpenMP 程 序 包 进行 并 行 编程 ， 并 举 了 一 个 OpenMP 的 扩展 示例 。 

第 6 草包 括 其 他 一 些 重 要 主题 。 如 末代 但 不 能 编译 ， 那 么 调试 工具 将 无 能 为 力 ， 因 此 这 一 章 
讨论 了 处 理 这 种 问题 的 一 些 方法 。 然 后 处 理由 于 缺少 必要 的 库 造 成 的 连接 失败 问题 ， 我 们 再 一 次 
觉得 提供 一 些 “ 理 论 ” 是 有 用 的 ， 比 如 库 的 芙 型 以 及 如 何 将 库 与 主要 代 介 连接。 如 何 调试 GUI 程 
FWE? 为 了 简便 起 见 ， 我 们 这 里 坚持 采用 “ 半 GUI” 设 置 一 一 curses 编 程 ， 并 显示 如 何 让 GDB、 
DDD 和 Eclipse 与 curses 窗 口中 的 事件 交互 。 

正如 前 面 提 到 的 ， 可 以 使 用 辅助 工具 使 调试 过 程 得 到 很 大 的 增强 ， 第 7 章 介 绍 了 部 分 辅助 工 
具 ， 还 介绍 了 errno 和 strace、1int 的 一 些 内 容 ， 以 及 对 于 有 效 使 用 文本 编辑 右 的 一 些 提示 。 

全 书 主要 介绍 的 是 C/C++ 编程 的 调试 ， 第 8 章 则 谈 到 了 其 他 语言 ， 包 括 Java、Python、Perl 和 
汇编 语言 。 

如 果 汤 挥 了 读者 喜欢 的 调试 主题 ,我 们 感到 抱 蒜 ， 书 中 包括 了 我 们 目 己 编程 时 发 现 有 用 的 全 
部 内 容 。 

感谢 No Starch Press 的 诸位 工作 人 员 在 这 个 项 目 上 花 了 很 长 时 间 来 协助 我 们 。 尤 其 感谢 公司 
的 创始 人 及 总 编辑 Bil Pollock。 他 一 开始 束 对 我 们 这 个 “非常 规 ” 项 目 抱 有 信心 ， 并 和 客 容 了 我 们 
的 多 次 延误 。 

Daniel Jacobowitz 对 本 书 的 初稿 做 了 认真 的 审 耕 ， 并 提出 了 许多 宝 贯 建议 。 还 有 Neil Ching, 
虽然 他 表面 上 是 做 文字 编辑 的 ， 实 际 上 却 是 拥有 计算 机 和 区 十 学 位 的 高 材 生 。 他 在 我 们 的 技术 讨论 
中 提出 了 一 些 重要 看 法 。 本 书 质量 的 提高 很 大 程度 上 得 益 于 从 Daniel 和 Neil 处 得 到 的 反馈 。 当 然 ， 
照例 要 做 一 下 免责 声明 : 如 果 还 有 错误 ， 那 一 定 是 我 们 目 己 造成 的 。 
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NormAy ili. JUN JEJE T Gamis & JLLaura, PAYS HY eA FILER ie SE a ES. A 
管 这 本 书 她 们 一 个 学 也 没 看 过 ,， 但 是 她 们 解决 问题 的 方法 、 幽 默 的 性 格 和 对 生活 的 热爱 深 深 地 影 
响 了 我 。 还 要 感谢 这 么 多 年 来 我 教 过 的 学 生 ， 他 们 教会 我 的 与 我 教会 他 们 的 一 样 多 ， 是 他 们 让 我 
觉得 我 选 对 了 职业 。 我 一 直 致 力 于 “有 所 作为 ”， 但 愿 这 本 书 能 算 作 我 的 一 个 小 小 作为 。 

Pete 的 致谢 。 我 还 要 感谢 Nicole Carlson, Mark Kim 和 Rhonda Salzma， 人 花 了 不 少时 间 来 通读 
本 书 的 各 革 ， 提 出 了 更 正 与 建议 ， 感 谢 你 们 阅读 本 书 。 还 要 感谢 Davis 的 Linux 用 户 组 上 这 么 多 年 
来 回答 我 问题 的 人 们 ， 认 识 你 们 使 我 更 聪明 。 感 谢 Evelyn 提 升 了 我 生活 的 方方面面 。 特 别 值得 一 
提 的 是 小 猫 号 Geordi， 它 总 是 趴 在 我 的 稿 纸 上 ， 以 免 稳 子 锐 吹 敬 ， 还 时 党 为 我 温暖 座 椅 ， 并 值守 
书房 。 我 每 天 都 在 想念 你 们 。 小 家 伙 ， 睡 吧 。 妈 妈 1， 看 儿子 棒 吗 ? 
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4e. 特 列 是 专业 人 士 ， 可 能 想到 跳 过 本 童 内 容 。 然 而 ， 我 们 建议 每 个 人 都 应 该 全 
少 简 单 浏 览 一 下 。 许 多 专业 人 士 会 从 中 发 现 一 些 对 于 他 们 来 说 是 全 新 的 内 容 。 无 论 如 
何 ， 所 有 读者 邦 应 该 熟悉 这 些 内 容 ， 这 一 所 很 重要 ， 因 为 其 后 的 各 革 部 将 用 到 这 些 内 容 。 当 然 ， 
饱学 者 更 应 该 仔细 地 阅读 本 章 。 

本 革 前 儿 廊 将 概述 调试 过 程 并 介绍 调试 工具 的 作用 ， 然 后 在 1.7 市 给 出 一 个 扩展 性 示例 。 


1.1 本 书 使 用 的 调试 工具 


本 书 中 ， 我 们 将 阐明 调试 的 基本 原则 ， 并 且 在 如 下 调试 工具 的 环境 中 说 明 这 些 基 本 原则 。 

e GDB 

Unix 程 序 员 最 常用 的 调试 工具 是 GDB， 这 是 由 Richard Stallman《〈 开 源 软件 运动 的 领路 人 ) JT 
发 的 GNU 项 目 调试 器 (GNU Project Debugger)， 该 工具 在 Linux 开 发 中 扮演 了 关键 的 角色 。 

大 多 数 Linux 系 统 应 该 预先 安装 了 GDB。 如 果 没 有 预先 安装 该 工具 ， 则 必须 下 载 GCC 编译 器 
程序 包 。 

e DDD 

BEXRGUI CEDERIP ZB RRR, Ae feUnix fe PIS AT INE T GUI VS A ak CIT c 
出 来 。 其 中 的 大 多 数 工具 都 是 GDB 的 GUI 前 端 : 用 户 通过 GUI 发 出 命令 ，GUI 将 这 些 命 令 传递 给 
GDB. DDD (Data Display Debugger, AE EKAR We PAST 

如 果 你 的 系统 还 没有 安装 DDD， 则 可 以 下 载 该 工具 。 例 如 ， 在 Fedora Linux 系 统 上 ， 命 令 


yum install ddd 












































2 


将 目 动 处 理 整 个 安装 过 程 。 在 Ubuntu Linux 上， 可 以 使 用 命令 apt-get。 

e Eclipse 

有 些 读者 可 能 使 用 过 IDE 集成 开发 环境 )。IDE 也 是 一 种 调试 工具 ， 它 在 一 个 程序 包 中 集成 
了 编辑 器 、 生 成 工具 、 调 试 器 和 其 他 开发 辅助 程序 。 本 书 中 的 示例 IDE 是 非常 流行 的 Eclipse 系统 。 
与 DDD 一 样 ，Eclipse 在 GDB 或 其 他 一 些 调试 右 的 基础 上 运行 。 

可 以 通过 如 上 所 述 的 yum 或 apt-get 命 令 安 装 Eclipse， 也 可 以 直接 下 载 相 应 的 .zip 文 件 ， 在 适 
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当 的 目录 (例如 /ser/ocal) 中 解压 缩 访 文件。 
本 书 使 用 3.3 版 本 的 Eclipse 系统 。 


1.2 ”编程 语言 
本 书 主要 面向 C/C++ 编程 ， 并 且 将 在 该 环境 中 完成 大 多 数 示例 。 不 过 ， 第 8 章 也 会 讨论 其 他 


—s 


ine 


1.3. ”调试 的 原则 


虽然 调试 是 一 门 乞 术 而 非 科 学 ， 但 是 仍然 有 一 些 明 确 的 原则 来 指导 调试 的 实践 。 本 贡 将 讨论 
其 中 一 些 原则 。 

至 少 其 中 的 一 个 规则 ， 即 确认 的 基本 原则 (Fundamental Principle of Confirmation) 实际 上 是 
相当 有 效 的 原则 。 


1.3.1 调试 的 本 质 : 确认 原则 

下 面 的 规则 说 明了 调试 的 本 质 。 

@ 确认 的 基本 原则 

修正 充满 错误 的 程序 ， 就 是 逐个 去 确认 你 认为 正确 的 代码 确实 是 正确 的 。 当 你 发 现 其 中 某 个 
假设 不 成 立时 ， 就 表示 已 经 找到 了 关于 程序 错误 所 在 位 置 的 线索 ( 其 至 是 错误 本 身 ). 

换 一 种 表达 方式 来 说 : TOR! 

当 你 认为 关于 程序 的 某 件 事 情 是 正确 的 ,但 却 不 能 确认 它 ， 你 束 会 感到 惊讶 。 但 这 种 惊讶 是 
好 事 ， 因 为 这 种 发 现 会 引导 你 找到 程序 错误 所 在 的 位 置 。 


1.3.2 ”调试 工具 对 于 确认 原则 的 价值 所 在 


传统 的 调试 技术 只 是 回程 序 中 添加 跟踪 代码 以 在 程序 执行 时 输出 变量 的 值 ， 例 如 使 用 
printf() 或 cout 语 句 输 出 变量 的 值 。 你 可 能 会 问 :“ 这 样 操作 还 不 够 吗 ? 为 什么 要 使 用 GDB、DDD 
或 Eclipse 这 样 的 调试 工具 ? ” 

首先 ， 这 种 方法 要 求 有 策略 地 持续 添加 跟踪 代码 ， 重 新 编译 程序 ， 运 行程 序 并 分 析 跟 踪 代 码 
的 输出 ,在 修正 程序 错误 之 后 删除 跟 踊 代码， 并 且 针 对 发 现 的 每 个 新 的 程序 错误 重复 上 述 这 些 步 
又 。 这 种 工作 过 程 非常 耗 时 ， 并 且 容 易 令 人 疫 萎 。 了 最 为 重要 的 是 ， 这 些 操作 将 你 的 注意 力 从 实际 
任务 转移 开 ， 使 你 无 法 集中 精力 通过 严密 推理 去 得 找 程序 错误 。 

相反 , 通过 使 用 DDD 和 Eclipse 这 样 的 网 形 化 调试 工具 ， 只 需要 将 鼠标 指针 移动 到 代 但 显示 中 
的 变量 实例 上 方 束 可 以 检查 该 变量 的 值 ， 并 有 旦 此 时 会 显示 该 变量 的 当前 值 。 为 什么 还 要 在 整 夜 的 
调试 中 使 用 printf() 语 句 来 输出 变量 的 值 ， 肥 无 必要 地 让 日 己 更 加 疲 筋 ,等待 更 长 的 时 间 呢 ?不 
如 放松 心情 ， 使 用 调试 工 其 可 以 减少 所 花费 的 时 间 ， 减 轻 你 需要 处 受 的 厌烦 感 。 

使 用 调试 工具 不 仅仅 能 够 得 看 变量 。 在 许多 情况 下 ， 调 试 器 会 指出 程序 错误 所 在 的 大 概 位 置 。 
例如 ， 程 序 由 于 段 错误 〈 即 内 存 访问 错误 ) 而 月 法 。 在 本 章 后 面 的 样本 调试 会 话 中 可 以 看 到 ， 
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GDB/DDD/Eclipse 可 以 立刻 指出 段 错 误 所 在 的 位 置 , 这 一 般 就 是 (或 接近 于 ) 程序 错误 所 在 的 位 置 。 

类 似 地 ， 调 试 器 要 求 用 户 设置 监视 点 〈watchpoint)， 通 过 监视 点 可 以 了 解 在 程序 运行 期 间 某 
个 变量 的 值 到 达 可 疑 值 范围 的 具体 位 置 ， 而 不 用 调试 器 ， 只 查看 调用 printf() 获 得 的 输出 很 难 推 
断 出 这 种 信息 。 
1.3.3 ”其 他 调试 原则 

e 从 简单 工作 开始 调试 

在 调试 过 程 的 开始 阶段 ， 应 该 从 容易 、 简 单 的 情况 开始 运行 程序 。 这 样 做 也 许 无 法 揭示 所 有 
的 程序 错误 ,但 是 很 有 可 能 发 现 其 中 的 部 分 错误 。 例如， 如 果 代 码 由 大 型 循环 组 成 ， 则 最 容易 发 
现 的 程序 错误 是 在 第 一 次 或 第 二 次 迭代 期 间 引 发 的 程序 错误 。 

e 使 用 自 顶 向 下 的 方法 

你 可 能 已 经 了 解 如 何 使 用 自 顶 向 下 或 模块 化 的 方法 来 编写 代码 : 主 程序 不 应 该 过 长 ， 它 应 该 
去 调用 那些 执行 大 量 实际 工作 的 函数 。 如 果 某 个 执行 实际 工作 的 函数 较 长 ， 则 应 该 考虑 将 该 函数 
依次 分 解 为 多 个 较 小 的 模块 。 

除了 应 该 以 目 项 同 下 的 方式 编写 代码 之 外 ， 也 应 该 以 这 种 方式 调试 代码 。 

例如 ,假设 程序 使 用 函数 f()。 在 使 用 调试 工具 深入 代码 并 且 壳 到 对 f() 的 调用 时 ， 调 试 器 可 
让 你 选择 执行 过 程 中 下 一 次 暂停 的 位 置 一 一 是 在 调用 函数 的 第 一 行 还 是 在 函数 调用 后 的 下 一 条 
语句 。 在 许多 情况 下 ， 先 选 后 一 种 比较 好 : 执行 调用 ， 然 后 检查 与 调用 有 关 的 变量 的 值 ， 从 而 了 
解 该 函数 是 否 正 确 运 行 。 如 果 该 函数 正确 运行 ， 就 可 以 避免 单 步调 试 函 数 中 代码 这 样 既 浪费 时 间 
又 不 必要 的 工作 ， 因 为 这 些 代 人 码 并 没有 出 错 。 

@ 使 用 调试 工具 确定 段 错 误 的 位 置 

当 发 生 段 错误 时 ， 执 行 的 第 一 步 操作 应 该 是 在 调试 器 中 运行 程序 并 重新 产生 段 错误 。 调 试 器 
将 指出 发 生 这 种 错误 的 代码 行 。 然 后 ， 可 以 通过 调用 调试 器 的 反 向 跟踪 (backtrace) 功能 获得 其 
他 有 用 信息 ， 该 功能 会 显示 出 错 前 所 有 函数 的 调用 序列 。 

在 某 些 情况 下 ， 可 能 很 难 重 新 产生 段 销 误 ， 但 是 如 果 有 核心 文件 〈core file)， 则 仍然 可 以 执 
行 反 向 跟踪 以 确定 产生 段 错误 的 情况 ， 第 4 章 将 讨论 这 个 问题 。 

e 通过 发 出 中 断 确定 无 限 循环 的 位 置 

如 果 怀 疑 程 序 中 存在 无 限 循环 , 则 进入 调试 器 并 再 次 运行 程序 , 让 该 程序 执行 足够 长 的 时 间 以 
进入 循环 。 然后， 使 用 调试 器 的 中 断 命 令 挂 起 该 程序 ， 并 是 执行 反 向 跟踪 ， 了解 已 到 达 循 环 主体 的 
哪个 位 置 以 及 程序 是 如 何 到 达 该 位 置 的 。( 该 程序 还 没有 被 取消 执行 ， 可 以 根据 需要 恢复 执行 。) 

e 使 用 二 分 搜索 

你 可 能 已 经 在 有 序列 表 的 环境 中 看 到 过 二 分 搜索 。 例 如 ， 假 设 你 有 一 个 数组 x[] 包 含 按 升 序 
排列 的 500 个 数字 ， 并 且 希 望 确定 在 应 何 处 插入 新 的 数字 y。 首 先 将 y 与 元 素 x[258] 进 行 比较 ， 如 
果 结 果 是 y 小 于 该 元 素 ， 接 下 来 就 将 y 与 元 素 x[125] 进 行 比较 ;但 是 如 果 y 大 于 x[256]， 则 下 一 次 
就 将 y 与 x[375] 进 行 比较 。 在 后 一 种 情况 中 , 如 果 y 小 于 x[375], 则 将 其 与 x[312] 进 行 比较 , x[312] 
是 x[258] 和 x[375] 之 间 的 中 间 元 素 ， 以 此 类 推 。 在 每 次 迭代 过 程 中 保持 将 搜索 范围 减 半 ， 从 而 快 
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速 查 找到 插入 点 。 

在 调试 过 程 中 也 可 以 应 用 二 分 搜索 的 原理 。 假 设 你 知道 在 最 初 的 1 000 ARMAR, 4$ 
储 在 某 个 变量 中 的 值 在 某 个 时 刻 出 现 问 题 ,那么 一 种 方法 是 使 用 监视 点 跟踪 该 值 第 一 次 出 现 问 题 
时 所 在 的 迭代 过 程 ，1.5.3 节 将 讨论 这 种 高 级 技术 。 男 一 种 方法 则 是 使 用 二 分 搜索 ， 此 时 在 时 间 而 
不 是 空间 上 进行 二 分 。 首 先 检查 该 变量 在 第 500 次 迭代 后 的 值 ， 如 果 此 时 其 值 仍然 良好 ， 则 下 一 
次 检查 位 于 第 750 次 迭代 后 的 值 ， 以 此 类 推 。 

再 从 发 一 个 例子 ,假设 程序 中 的 茶 个 源 文件 根本 无 法 编译 ,由 语法 错误 产生 的 编译 器 消 居中 ， 
提 及 的 代码 行 有 时 与 实际 的 错误 位 置 相 去 其 还 ， 因 此 可 能 很 难 确定 该 位 置 。 在 这 种 情况 下 ， 二 分 
搜索 就 可 以 派 上 用 场 : NER CRER SPE OP APTS, Seer gin PER aR TSE 
误 消 居 是 否 仍然 存在 。 如 果 错 误 消 恩 仍 然 存 在 ， 则 错误 束 在 这 一 半 代 人 码 中 ; 如 果 错 误 消 息 不 再 出 
现 ， 则 错误 就 位 于 删除 的 那 一 半 代 码 中 。 一旦 确定 了 包含 程序 错误 的 一 半 代 码 ， 束 可 以 进一步 将 
程序 错误 限制 在 这 半 部 分 代码 的 一 半 ， 继 续 执行 相同 的 操作 直到 确定 问题 所 在 位 置 。 当 然 ， 在 开 
台 该 过 程 之 前 应 该 建立 原始 代码 的 副本 ， 或 者 更 好 的 方法 是 使 用 文本 编辑 需 的 撤销 功能 。 参 见 第 
7 瘟 ， 了 解 在 编程 时 适当 地 使 用 编辑 器 的 技巧 。 
1.4 ”对比 基 于 文本 的 调试 工具 与 基于 GUI 的 调试 工具 ， 两 者 之 间 的 折 

中 方案 

本 书 讨论 的 GUI (CDDD 和 Eclipse) 充当 用 于 C 和 C++ 的 GDB 以 及 其 他 调试 器 的 前 端 。 虽 然 GUI 
具有 显眼 的 外 观 并 且 使 用 起 来 也 比 基 于 文本 的 GDB 更 为 方便 , 但 是 本 书 主张 的 观点 是 基于 文本 的 
调试 器 和 基于 GUI 的 调试 右 〈 包 括 IDE) 在 不 同 环境 下 各 有 上 所 长 。 
1.4.1 简要 比较 界面 

为 了 快速 了 解 基于 文本 的 调试 工具 和 基于 GUI 的 调试 工具 之 间 的 区 别 ， 来 看 看 将 它们 用 于 本 
草 示 例 的 情况 。 该 示例 中 的 程序 是 jsert sort， 通 过 源 文件 ins.c 编 译 该 程序 ， 其 完成 的 是 插入 排 
序 。 

1. GDB: 纯 文 本 

为 了 使 用 GDB 局 动 针 对 这 个 程序 的 调试 会 话 ， 可 以 在 Unix 命 令 行 中 输入 如 下 命令 : 


$ gdb insert sort 































































































在 此 之 后 ，GDB 会 通过 显示 如 下 提示 符 来 邀请 你 提交 命令 : 
(gdb) 
2. DDD: GUI 调试 工具 
使 用 DDD 时 ， 通 过 在 Unix 命 令 行 中 输入 如 下 命令 来 开始 调试 会 话 ; 
$ ddd insert sort 


此 时 将 打开 DDD 窗 口 ， 在 此 之 后 殉 可 以 通过 GUI 提交 命令 。 
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DDD 和 窗口 的 一 般 外 观 如 图 1-1 所 示 。 可 以 看 到 ，DDD 窗 口 在 各 个 子 窗口 中 安排 信息 。 

O 源 文本 窗口 显示 源 代 人 码 。DDD 从 main() 也 数 处 开始 显示 ， 但 是 可 以 通过 使 用 窗口 右 侧 的 
滚动 条 移动 到 源 文 件 的 其 他 部 分 。 

O 菜单 栏 提供 各 种 菜单 类 别 ， 包 括 File (文件 )、Edit (编辑 ) 和 View (视图 )。 

a 命令 工具 列 出 最 常见 的 DDD 命 令 (例如 Run、Interrupt、Step 和 Next)， 从 而 可 以 快速 访问 


a 控制 全: 回顾 一 下 DDD 只 是 GDB 〈 和 其 他 调试 豆 ) 的 GUI 前 咒 。DDD 将 忌 标 选中 的 命 
令 转换 为 对 应 的 GDB 命 令 。 这 些 命令 和 它们 的 输出 显示 在 控制 台 窗 口中 。 此 外 ， 可 以 下 
接 通 过 控制 侣 窗口 提交 命令 给 GDB， 这 是 非 第 方便 的 功能 ， 因 为 并 不 是 所 有 的 GDB 命 令 
邦 有 对 应 的 DDD 命 令 。 

O 数据 帘 口 显示 已 经 请 求 连 续 吕 示 的 变量 的 值 。 在 执行 这 样 的 请 求 之 前 ， 这 个 子 千 口 不 会 
出 现 ， 因 此 它 没 有 出 现在 图 1-1 中 。 









































‘AO DDD: /home/p/code/InsLotsOfErrors.c 一 口 X 





File Edit View Program Commands Status Source Data 


p - = * ot = RLS SS " DEORE due 
(9 InskotsofErrors.c:1& (s E] e Uatch Ji Ls We 会 "es Z ondiep X HRS 


E 





2 // insertion sort, several errors 
// 


4 // usage: insert sort numi num2 num3 ..., where the numi are the numbers to 
5 //| be sorted 
6 
7- int x[10],  // input array 
8 vy[10], // workspace array 
9 num inputs,  // length of input array 
10 num y = 0; // current number of elements in y a 
11 BO DDD x 
12 void get argsí(int ac, char **av) Run 
d= T —nE 4; 
14 Interrupt | 
15 num inputs - ac - 1; Ste Ste 
Q6 for (i = 0; i < num inputs; i++) . Step | Step | 
17 x[i] = atoi(av[it1]); Next | Nexti | 
18 } Ary AX 
19 . Unt | Finish | MLA 
20 void scoot over(int jj) Cont Kill 
p _ cot | ow | 


21. { in 

= Up | Down | 
23 for (k = num y-1; k > jj; k++) Undo | Redo 
24 y[k] = y[k-1]; 

25 } 

26 


27 void insert(int new y) 


29 { int j; Y » BS 
29 源 文 本 窗口 
30 if (num y = 0) { // y empty so far, easy case 

31 y[0] = new vy; 

32 return; 

33 } 


Copyright © 2001-2004 Free Software Foundation, Inc. 
Using host libthread_db library "/lib/libthread_db.so.1". 





(gdb) break InsLotsOfErrors.c: 73 Hel] 公 
Breakpoint 1 at 0x80483b6: file InsLotsOfErrors.c, line 16. 控制 H 
(gdb) - 
A Set and edit breakpoints in source files J 


图 1-1 DDD 布 局 


下 面 简单 演示 在 每 种 类 型 的 用 户 界 面 下 如 何 将 调试 命令 提交 给 调试 器 。 在 调试 insert sort 程 
序 时 ， 你 可 能 希望 暂停 该 程序 的 执行 ， 从 而 在 函数 get_args() 的 第 16 行 (假设 ) 处 设置 断 点 (在 
1.7 市 中 将 看 到 insert_sort 的 完整 源 代 人 码 )。 为 了 在 GDB 中 设置 断 点 ， 可 以 在 GDB 提 示人 符 中 输入 如 
下 命令 


(gdb) break 16 


完整 的 命令 名 是 break， 但 是 GDB 人 允许 在 不 产生 歧义 的 情况 下 使 用 缩写 ， 并 且 大 多 数 GDB 用 
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户 会 在 此 处 输入 b 16。 考 虑 到 GDB 的 初学 者 不 易 理 解 这 些 缩写 ， 我 们 将 先 使 用 完整 的 命令 名 ， 在 
本 书 的 后 面 ， 当 用 户 已 经 较为 熟悉 这 些 命令 时 我 们 再 使 用 缩写 。 

使 用 DDD, 将 查看 源 文本 窗口 , 单 击 第 16 行 的 开始 位 置 , 然后 单 击 DDD 屏 幕 顶端 的 Break (中 
Wr) 图 标 。 也 可 以 在 第 16 行 的 开始 位 置 右 击 ， 然 后 选择 Set Breakpoint( 设 置 断 点 )。 男 一 种 方法 
是 在 代码 行 开 始 位 置 左 侧 的 任意 位 置 双击 该 代码 行 。 无 论 采 用 何 种 方法 , DDD 都 会 通过 在 该 行 中 
显示 小 的 停止 符号 来 确认 选择 ， 如 图 1-2 所 示 。 通 过 这 种 方式 ， 可 以 快速 浏览 断 点 。 


中 OO 


































DDD: /home/p/code/InsLotsOfErrors.c 





" ay A J WAT CX "S ND ^y 
InsLotsÜfErrors.c:18 9 dd O å F A dM UA C £2 X 
ninar WSC) EMTs Displays PIT: HOW) BOTSTE Set rsp 
2 // insertion sort, several errors 
3 ff 
4 // usage: insert sort numi num2 num3 ..., where the numi are the numbers to 


5 // be sorted 
6 













7 int x[10], // input array 

8 y[10], // workspace array 

9 num inputs,  // length of input array 
T num_y 0; // current number of elements in y EO DDD X 
12 void get args(int ac, char **av) 
JS t ane d* 
14 
15 num inputs = ac - 1; 

Q6 for (i = 0; i < num inputs; itt) 

zn x[i] = atoi(av[iti]); 
18 } 
19 
20 void scoot over(int jj) 
21 ( inb k; 
22 
23 for (k = num y-1; k > jj; k++) 
24 ylk] = y[k-1]; 
25.) 
26 
27 void insert (int new y) 
20 { ane oy; 


29 


30 if (num y = 0) { // y empty so far, easy case 
31 y[0] = new y; 
32 return; 


33 


Copyright © 2001-2004 Free Software Foundation, Inc. 
Using host libthread db library "/lib/libthread db.so.1". 
(gdb) break InsLotsOfErrors.c:16 

Breakpoint 1 at 0x80483b6: file InsLotsOfErrors.c, line 16. 
(gdb) 





图 1-2 ”上 断 点 设置 


3. Eclipse: 不 只 是 GUI 调 试 器 

图 1-3 显 示 了 Eclipse 中 的 和 常规 环境 ， 按 照 Eclipse 术 语 ， 我 们 当前 正 处 于 调试 透视 图 (Debug 
Perspective) 中 。Eclipse 是 开发 许多 不 同类 型 软件 的 常规 框架 。 每 种 编程 语言 在 Eclipse 中 都 有 上 自 
己 的 插件 GUI， 即 透视 图 。 实 际 上 ， 对 于 同一 种 语言 可 能 有 多 个 竞争 的 透视 图 。 在 本 书 的 Eclipse 
操作 中 ， 我 们 将 使 用 用 于 CC++ 开 发 的 CC++ 透 视图 、 用 于 编写 Python 程序 的 Pydev 透 视图 等 。 也 
有 用 于 执行 实际 调试 工作 的 调试 透视 图 〈( 帝 有 一 些 语言 特有 的 功能 )， 图 1-3 束 显示 了 该 透视 图 。 

C/C++ 透视 图 是 CDT 插 件 的 一 部 分 。 类 似 于 DDD 的 悄 况 ，CDT 在 后 台 调 用 GDB。 

透视 图 的 相关 组 件 大 体 上 类 似 于 上 和 面 所 朱 述 的 DDD 的 窗口 组 件 , 透 视图 被 分 解 为 多 个 称 为 视 
图 的 选项 卡 趟 窗口 。 位 于 透视 图 堪 侧 的 是 源 文 件 加 gc 的 视图 , 也 有 用 于 检查 变量 值 的 变量 视图 (这 
时 该 视图 中 还 没有 任何 变量 值 ), 此 外 还 有 控制 台 视 图 ， 其 功能 非常 类 似 于 DDD 中 的 同名 子 窗口 ， 
另外 还 有 其 他 的 视图 。 

可 以 按照 与 在 DDD 中 相同 的 操作 来 可 视 化 地 设置 断 点 。 例 如 ， 在 图 1-4 中 ， 源 文件 窗口 中 的 
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代码 行 
for (i = 0; i « num inputs; i++) 


TEC ALAM Vo Xue EMI PECES. KREA TS 





v DR - insert_sort/ins.c - Eclipse Platform 


File Edit Refactor Navigate Search Project Run Window Help 
Jg e|] O- S Je |a 








[8 ins.c 23 
// Atmerti0n SULL, Severdi errurs 


// 


// usage: insert sort numl num2 num3 ..., where the numi are the numl 
// be sorted 





int x[10], // input array n sint 
y[10], // workspace array num. inputs : i 
num inputs, // length of input array num. y : int 
nun y = 0; // current number of elements in y get. args(int, char") : void 


void get_ args(int ac, char **av) scoot_over(int) : void 
insert(int) : void 











Eile Edit Refactor Navigate Search Project Run Window Help 
v us|&|*- O- Q- | 7 | Bie ie € e 








Y 回 insert_sort [C/C++ Local Application] 
"v GÈ gdb/mi (12/11/07 9:29 PM) (Suspended) 
"v gf? Thread [0] (Suspended: Breakpoint hit.) 
= 2 get. args() /workspace/insert_sort/ins.c:15 0x080483 
= 1 main0 /workspace/insert_sort/ins.c:63 0x08048542 


num_inputs = ac - 1; 
for (i = 0; i < num inputs; i++) 
x[i] = atoi(av[i+1]); 
num_inputs : int 
void scoot_over(int jj) num_y : int 
{ int k; get args(int, char**) : void 
for (k = num y-1; k > jj; k++) scot -oveni ved 
y[k] = y[k-1]; insert(int) : void 


_brocess dataü : void 





1-4 在 Eclipse 中 删除 断 点 
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4. Eclipse 与 DDD 的 对 比 

Eclipse 也 有 一 些 DDD 所 没有 的 辅助 功能 。 例 如 ，Eclipse 环 境 的 右 侧 是 Outline 视 图 ， 该 视图 中 
列 出 了 变量 、 函 数 等 信息 。 如 果 单 击 函数 scoot _over() 对 应 的 条 目 ， 则 源 文件 视图 中 的 光标 将 会 
移动 到 该 函数 上 。 此 外 ， 如 果 临 时 从 调试 透视 图 移动 回 正在 其 中 对 该 项 目 执 行 编 辑 和 编译 的 
C/C++ 透视 图 (此 处 没有 显示 )， 则 也 可 以 管理 Outline 视 图 。 这 对 于 大 型 项 目 非常 有 帮助 。 

Eclipse 更 好 地 集成 了 编辑 和 编译 过 程 。 如 果 产 生 编 译 错误 ， 则 会 在 编辑 器 中 清楚 地 标记 出 这 
些 错 误 。 可 以 使 用 Vim 编 辑 器 完成 该 操作 , 与 IDE 相 比 , 本 书 的 两 位 作者 都 倾向 于 使 用 Vim 编 辑 器 ， 
但 是 IDE 可 以 更 好 地 执行 该 操作 。 

另 一 方面 ， 可 以 看 到 与 大 多 数 IDE 一 样 ，Eclipse 在 屏幕 (实际 上 是 本 书 中 的 页 面 ) 上 占据 了 
大 量 的 空间 。 无 论 使 用 多 少 ，Outline 视 图 都 会 占据 屏 舌 中 的 宝贵 空间 。 诚 然 ， 可 以 通过 单 击 石 上 
角 的 区 按钮 来 隐藏 Outline 视 图 以 回收 一 些 空 间 〈 如 果 需 要 恢复 显示 该 视图 ， 可 以 选择 Window 一 
Show View 一 Outline)， 也 可 以 将 选项 卡 拖 动 到 Eclipse 窗口 中 的 不 同位 置 。 但 是 一 般 来 说 ， 可 能 很 
难 较 好 地 利用 Eclipse 中 的 屏 贤 空间 。 

记 住 ， 始 终 可 以 直接 在 DDD 的 控制 台中 执行 GDB 命 令 。 因 此 ， 你 可 以 灵活 地 以 最 为 方便 的 
方法 执行 调试 命令 ， 有 时 是 通过 DDD 界 面 ， 而 有 时 则 是 通过 GDB 命 令 行 。 在 本 书 的 不 同 部 分 中 ， 
将 看 到 可 以 使 用 GDB 执 行 大 量 操 作 ， 这 些 操作 可 以 人 简化 调试 工作 。 

通过 对 比 可 以 得 知 ，GDB 对 于 Eclipse 用 户 来 说 基本 是 透明 的 ， 虽 然 过 去 的 说 法 “无 知 即 是 快 
乐 ” 通 常 也 适用 , 但 是 这 种 透明 性 意味 着 你 将 不 能 方便 地 使 用 可 以 通过 直接 利用 GDB 执 行 的 节省 
劳动 量 的 操作 。 在 编写 本 书 时 ,心意 坚决 的 用 户 仍 然 可 以 通过 如 下 方法 直接 访问 GDB: 在 调试 透 
视图 中 单 击 GDB 线 程 ， 然 后 使 用 控制 台 。 但 是 这 种 方法 缺少 GDB 提 示 符 。 然 而 ， 这 种 “未 归档 
的 功能 ”在 将 来 的 版 本 中 可 能 不 再 存在 。 

5. GUI 的 优点 

DDD 和 Eclipse 提供 的 GUI 界面 比 GDB 提 供 的 GUI 界面 的 外 观 更 加 形象 ， 并 且 使 用 起 来 也 更 方 
便 。 例 如 ， 倘 知 不 再 需要 在 get_args() 的 第 16 行 处 暂停 执行 ， 也 束 是 希望 清除 该 位 置 中 的 断 点 ， 
在 GDB 中 ， 可 输入 如 下 命令 来 清除 断 点 。 


(gdb) clear 16 


然而 ， 为 了 执行 该 操 作 ， 需 要 记 住 断 点 所 在 的 行 号 (如 果 同 时 有 许多 有 效 的 断 点 ， 记 住 这 些 
行 写 束 不 容易 )。 可 以 使 用 GDB 的 info _ break 命令 列 出 所 有 断 点 ， 来 重新 记 住所 有 的 行 号 ， 但 是 
这 增加 了 一 定 的 工作 量 ， 并 且 会 分 散 你 得 找 程序 错误 的 注意 力 。 

在 DDD 中 ,你 的 任务 将 会 简单 很 多 : 为 了 清除 断 点 ， 只 需要 单 击 所 需 行 中 的 停止 符号 ， 然 后 
单 击 Clear 按 钮 ， 停 止 符 号 将 会 消失 ， 表 明 已 经 清除 该 断 点 。 

在 Eclipse 中 ， 可 以 进入 Breakpoint 视 网， 突出 显示 需要 删除 的 断 点 ， 然 后 将 鼠标 光标 移动 到 
灰色 的 里 按钮 上 ， 该 按钮 表示 删除 所 选择 断 点 的 操作 ， 如 网 1-4 所 示 。 也 可 以 右 击 源 代 但 宿 口 中 
HT WE CLIE EX JF TE Toggle Breakpoint 命 令 。 

判断 何 种 GUI 可 以 更 为 有 效 地 执行 清除 断 点 工作 的 一 项 任务 是 单 步调 斌 代码。 与 GDB 相 比 ， 
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使 用 DDD 或 Eclipse 可 以 更 加 方便 而 舒适 地 执行 清除 断 点 的 工作 , 因为 可 以 在 GUI 的 源 代 码 窗 口中 
监视 在 代码 中 的 移动 。 通 过 箭头 指示 源 代 但 中 将 要 执行 的 下 一 个 代码 行 ， 如 网 1-$ 中 的 DDD 源 代 
公 窗 口 所 示 。 在 Eclipse 中 ， 以 绿色 突出 显示 要 执行 的 下 一 个 代码 行 。 因此， 可 以 一 眼看 出 目前 相 
对 于 其 他 程序 语句 所 在 的 位 置 。 

6. GDB 的 优点 

综 上 所 述 ， 与 基于 文本 的 GDB 相 比 ， 这 些 GUI 有 许多 优点 。 然 而 ， 根 据 该 示例 就 笼统 地 断定 
GUI 好 于 GDB 并 不 见得 正确 。 

成 长 过 程 中 一 直 使 用 GUI 完成 联机 执行 的 一 切 事 务 的 年 轻 程 序 员 ， 目 然 更 喜欢 使 用 GUI 而 非 
GDB， 很 多 年 纪 大 些 的 程序 员 也 是 如 此 。 但 是 ，GDB 也 有 一 些 突出 的 优点 。 

a GDB 的 启动 速度 比 DDD 快 许多 ， 当 只 需要 快速 检查 代码 中 的 某 项 内 容 时 ， 这 就 是 很 重要 

的 优点 。 在 与 Eclipse 比 较 时 ， 这 种 局 动 时 间 上 的 优势 更 明显 。 

a 在 某 些 情况 下 ， 需 要 从 公共 终端 通过 SSH (或 远程 登录 ) 远程 执行 调试 。 如 果 没 有 安装 
X11， 就 完全 不 能 使 用 GUI， 即 使 有 X11，GUI 的 屏幕 刷新 操作 也 会 非常 缓慢。 

a 当 调 试 彼此 之 间 协 同 操 作 的 多 个 程序 时 〈 例 如， 网络 化 环 声 中 的 客户 /服务 器 程序 )， 束 需 
要 针对 每 个 程序 打开 独立 的 调试 窗口 。 与 DDD 相 比 ，Eclipse 中 的 情况 稍 好 ， 因 为 Eclipse 
允许 在 同一 个 窗口 中 同时 调试 两 个 程序 ， 但 是 这 也 会 带 来 前 面 提 及 的 空间 问题 。 因 此 ， 
与 GUI 占据 大 量 屏幕 空间 相 比 ，GDB 占 据 的 可 视 空间 少 是 很 重要 的 优点 。 

a 如 果 正 在 调试 的 程序 有 GUI， 并 且 使 用 的 是 基于 GUI 的 调试 吉 DDD), WPS z lal wt 
可 能 产生 冲突 。 其 中 某 个 程序 的 GUI 事件 〈 按 键 、 鼠 标 单 击 和 鼠标 移动 )， 可 能 会 干扰 另 

个 程序 的 GUI 事件 , 并 且 被 调试 的 程序 在 调试 器 下 运行 时 可 能 具有 与 独立 运行 时 不 同 的 
行为 。 这 可 能 会 使 查找 程序 错误 变 得 相当 复杂 。 

相 比 于 GUI 中 便利 的 鼠标 操作 ，GDB 所 需 的 大 量 输入 操作 显得 十 分 兵 烦 ， 但 必须 注意 的 是 
GDB 也 包括 一 些 减少 输入 量 的 方法 , 从 而 使 其 基于 文本 的 特性 更 容易 被 用 户 接受 ,本 草 前 面 提 太 ， 
GDB 的 大 多 数 命 令 都 有 简短 的 缩写 方式 ,大 多 数 人 都 使 用 这 种 缩写 方式 而 不 是 完整 的 命令 名 。 同 
FE. 15 A Ctrl+P AI Ctrl+N 2H 4 BE n] EL ju] à. EA BU HI dir 21 E v EEN I RACES m V Hm ZR 
ENTER 键 即 可 重复 发 出 上 一 个 命令 《在 重复 执行 next 命 令 一 次 一 行 地 单 步调 试 代码 时 ， 这 种 方 
法 束 非 党 有 用 ); 此 外 还 有 define 命 令 ， 用 户 可 以 定义 顷 写 和 宏 。 第 2 革 和 第 3 革 将 评 细 介绍 这 些 
功能 。 

7. 总 结 : 每 种 工具 都 有 其 价值 

我 们 认为 GDB 和 GUI 都 是 非常 重要 的 工具 , 并 且 本 书 将 同时 给 出 GDB、DDD 和 Eclipse 的 相关 
示例 。 我 们 将 始终 使 用 GDB 切 入 所 有 主题 ， 因 为 GDB 具 有 这 些 工 具 所 共有 的 特性 ， 然 后 再 将 讨 
论 扩 展 到 GUI。 


1.4.2” 折 中 方法 


从 版 本 6.1 以 来 ，GDB 已 经 以 名 为 TUI (Terminal User Interface， 终 端 用 户 界 面 ) 的 模式 提供 
了 基于 文本 交互 和 图 形 用 户 交 互 之 间 的 折 中 方法 。 在 这 一 模式 中 , GDB 将 终端 屏幕 划分 为 类 似 于 
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DDD 的 源 文 本 窗口 和 控制 台 的 多 个 子 窗口 : 可 以 在 类 似 于 源 文 本 窗口 的 子 窗口 中 跟踪 程序 执行 的 
进展 过 程 ， 同 时 在 类 似 于 控制 台 的 子 窗口 中 发 出 GDB 命 令 。 也 可 以 使 用 男 一 个 程序 CGDB， 它 也 
提供 了 类 似 的 功能 

1. 处 于 TUI 模 式 的 GDB 

为 了 以 TUI 模 式 运 行 GDB， 可 以 在 调用 GDB 时 在 命令 行 上 指定 -tui 选 项 ， 或 者 处 于 非 TUI 模 
式 时 在 GDB 中 使 用 Ctrl+X+A 组 合 键 。 如 果 当 前 处 于 TUI 模 式 ， 后 一 种 命令 方式 束 会 使 你 离开 TUI 
模式 。 

在 TUI 模 式 中 ，GDB 窗 口 划 分 为 两 个 子 窗口 ， 一 个 用 于 输入 GDB 命 令 ， 而 男 一 个 用 于 查看 源 
R. Mixt insert sort 以 TUI 模 式 启 动 GDB， 然 后 执行 儿 个 调试 命令 ，GDB 屏 舌 就 可 能 如 下 
所 示 : 











11 
12 void get args(int ac, char **av) 
13 ( inti; 
14 
15 num inputs = ac - 1; 

* 16 for (i = 0; i < num inputs; i++) 

> 17 x[i] = atoi(av[i+1]); 

18 } 
19 
20 void scoot_over(int jj) 
21 { int k; 
22 
23 for (k = num y-1; k > jj; k++) 

File: ins.c Procedure: get args Line: 17 pc: 0x80484b8 


(gdb) break 16 

Breakpoint 1 at 0x804849f: file ins.c, line 16. 
(gdb) run 12 5 6 

Starting program: /debug/insert sort 12 5 6 


Breakpoint 1, get args (ac-4, av=Oxbffff094) at ins.c:16 
(gdb) next 
(gdb) 


如 果 正 在 使 用 GDB 但 没有 使 用 TUI 模 式 ， 则 位 于 下 方 的 子 窗口 确切 地 显示 你 将 看 到 的 内 容 。 
此 处 ， 该 子 窗口 显 示 如 下 内 容 。 
O 有 友 出 一 条 break 命 令 ， 在 当前 源 文件 的 第 16 行 处 设置 断 点 。 
O 执行 run 命 令 运 行程 序 ， E 令 行 参 数 12、5 和 和 6。 在 此 之 后 ， 调 试 右 在 指 
定 的 断 点 处 停止 执行 (后 面 将 介绍 run 和 其 他 GDB 命 令 )。GDB 会 提醒 用 户 断 点 位 于 ins.c 
的 第 16 行 ， 并 且 通 知 该 源 代 码 行 的 机 器 代码 驻 旬 加 在 内 存 地 址 6x864849f 中 。 
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O 发 出 next 命 令 ， 步 进 到 下 一 个 代码 行 ， 即 第 17 行 。 

上 方 的 子 窗 口 提 供 了 一 些 额 外 的 、 形 象 的 帮助 信息 。 此 处 ， 与 DDD 和 Eclipse 相同 ，TUI 显 示 
了 当前 执行 的 代码 行 上 下 的 其 他 源 人 代码。 这样 束 可 以 更 方便 地 查看 当前 位 于 代码 中 的 位 置 。 分 别 
使 用 星 号 和 > 符号 指示 断 点 和 当前 执行 的 代码 行 ， 这 两 个 符号 分 别 类 似 于 DDD 的 停止 符号 和 绿色 
Bi] 2A o 

通过 使 用 上 下 方向 键 进行 深 动 来 移动 到 代码 的 其 他 部 分 。 如 果 没 有 处 于 TUI 模 式 中 ， 束 可 以 
使 用 箭头 键 来 浏览 以 前 的 GDB 命 令 ， 从 而 修改 或 重复 执行 这 些 命令 。 在 TUI 模 式 中 ， 箭 头 键 用 于 
滚动 源 代 码 子 窗口 ， 可 以 使 用 Ctr+P 和 Ctrl+N 组 合 键 来 浏览 以 前 的 GDB 命 令 。 同 样 ， 在 TUI 模 式 
中 , 可 以 使 用 GDB 的 1ist 命 令 更 改 源 代码 子 窗口 中 显示 的 代码 区 域 。 在 操作 多 个 源 文件 的 情况 下 ， 
该 功能 驶 非常 有 用 。 

通过 使 用 GDB 的 TUI 模 式 和 它 的 输入 快捷 方式 ， 可 以 在 不 受 GUI 不 利 方面 影响 的 情况 下 用 到 
GUI 的 许多 优秀 功能 。 然 而 需要 注意 的 是 ， 在 一 些 情况 下 TUI 可 能 不 能 按照 用 户 所 需要 的 方式 运 
作 ， 这 时 束 需 要 寻找 相应 的 解决 方案 。 

2. CGDB 

2j; —^ HHWIGDBZ-BZECGDB, iZ 7i n] EAM Attp://cgdb.sourceforge.net/Akf3. CGDBi fE 
供 了 一 种 基于 文本 的 方法 与 GUJ 方 法 之 间 的 折 中 方案 。 与 GUI 类 似 ，CGDB 起 GDB 前 端的 作用 。 
CGDB 从 概念 上 类 似 于 基于 终端 的 TUI， 但 它 更 吸引 人 ， 因 为 是 彩色 界面 ， 而 且 可 以 浏览 源 代码 
子 窗口 ， 并 直接 在 子 窗口 中 设置 断 点 。CGDB 处 理 屏 幕 刷 新 的 能 力 似 乎 也 比 GDB/TUI 强 。 

下 和 面 是 CGDB 的 儿 个 基本 命令 与 约定 。 

a 按 下 ESC 键 可 以 从 命令 窗口 转 到 源 代码 窗口 ， 按 下 i 键 返回 。 

a 当 光 标 在 源 代码 窗口 中 时 ， 可 以 用 键 头 键 或 功能 类 似 于 vi 的 键 Gan Iu P» kR HE, 

/表示 查找 ) 在 源 代 码 窗口 中 随意 移动 。 

O 要 执行 的 下 一 行 用 箭头 标记 。 

a 为 了 在 通过 光标 突出 显示 的 当前 代码 行 上 设置 断 点 ， 只 要 按 下 空格 键 即 可 。 

O 断 点 行 的 行 号 用 红色 突出 显示 。 
1.5 ”主要 调试 器 操作 

本 届 概述 调试 器 提供 的 主要 操作 类 型 。 
1.5.1 单 步调 试 源 代码 

前 面 介绍 过 ， 在 GDB 中 是 用 run 命 令 运行 程序 ， 在 DDD 中 是 单 击 Run 按 钮 。 在 后 面 介绍 详细 
内 容 时 ， 可 以 看 到 Eclipse 运行 程序 的 方式 也 是 类 似 的 。 

也 可 以 安排 程序 在 某 个 地 方 暂 停 执 行 ， 以 便 检 查 变量 的 值 ， 寻 求 程 序 错误 所 在 位 置 的 线索 。 
下 面 是 可 用 来 暂停 程序 执行 的 一 些 方法 。 

e Pp S 

正如 前 面 所 提 到 的 ， 调 试 工具 会 在 指定 断 点 处 暂停 程序 的 执行 。 在 GDB 中 是 通过 break 命 令 
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及 源 代 码 行 号 完成 的 ， 在 DDD 中 是 在 相关 代 但 行 的 任意 空白 处 右 击 并 选择 Set Breakpoint 来 完成 
的 ， 在 Eclipse 中 是 在 代码 行 左 边 的 页 边 宇 白 处 双击 完成 的 。 

e 单 步调 试 

表面 提 到 过 ，GDB 的 next 命 令 让 GDB 执 行 下 一 行 ， 然 后 暂停 。step 命 令 的 作用 与 此 类似 ， 
只 是 在 函数 调用 时 step 命 令 会 进入 图 数 ,而 next 导 致 下 一 次 暂停 出 现在 调用 函数 之 后 。DDD 有 对 
应 的 Next 和 Step 荣 单项 ， 而 Eclipse 是 通过 Step Over 和 Step Into 图 标 完 成 这 一 功能 的 。 

e 恢复 操作 

在 GDB 中 ，continue 命 令 通 知 调试 磊 恢复 执行 ， 直 到 遇 到 新 断 点 为 止 。DDD 中 有 一 个 对 应 
的 某 单 项 ，Eclipse 中 有 一 个 Resume 图 标 ， 都 能 完成 这 一 功能 。 

e GAY bp 

在 GDB 中 ，tbreak 命 令 与 break 相 似 ， 但 是 这 一 命令 设置 的 断 点 在 首次 到 达 访 指定 行 后 束 不 
册 有 效 ， 只 使 用 一 次 。 在 DDD 中 临时 断 点 的 设置 方式 为 : 在 源 文本 窗口 中 要 设置 断 点 的 代码 行 的 
任意 空白 处 右 击 ， 然 后 选择 Set Temporary Breakpoint。 在 Eclipse 中 ， 突 出 显示 源 代 但 窗口 中 要 议 
置 断 点 的 代码 行 ， 然 后 右 击 并 选择 Run to Line. 

GDB 中 还 有 创建 特殊 类 型 的 一 次 性 断 点 的 命令 ; until 和 finish。DDD 的 命令 工具 中 有 对 应 
的 Until 和 Finish 项 ，Eclipse 中 有 Step Return。 这 些 内 容 将 在 第 2 章 讨 论 。 

程序 执行 的 典型 调试 模式 如 下 《以 GDB 为 例 ): 单 击 一 个 断 点 后 ， 通 过 GDB 的 next 命 令 一 次 
移动 一 行 代码 , 或 通过 step 命 令 单 步调 试 一 段 时 间 , 以 便 仔 细 检 查 靠 近 断 点 处 的 程序 状态 和 行为 。 
做 完 这 些 操 作 后 ， 可 以 用 continue 命 令 让 调试 占 继 续 执 行程 序 ， 直 到 过 到 下 一 个 断 点 为 止 ， 其 间 
不 需要 和 暂 俘 。 
1.5.2 ”检查 变量 

当 调 斌 器 暂停 了 程序 的 执行 后 ， 可 以 执行 一 些 命令 来 显示 程序 变量 的 值 。 这些 变 量 可 以 是 局 
部 变量 、 全 局 变量 、 数 组 的 元 素 和 C 语 言 的 struct、C++ 类 中 的 成 员 变 量 等 。 如 果 发 现 某 个 变量 
有 一 个 出 平 意料 的 值 , 那 往 往 是 找 出 某 个 程序 错误 的 位 置 和 性 质 的 重要 线索 。DDD 甚 至 可 以 用 图 
来 表示 数组 ， 从 而 直观 地 表达 数组 中 的 可 疑 值 或 者 发 生 的 某 种 趋势 。 

最 基本 的 和 变量 显示 类 型 是 仅仅 输出 当前 值 。 例 如 ， 假 设 在 ins.c 中 的 函数 insert() 的 第 37 行 处 
设置 了 一 个 断 点 。( 同 样 ， 完 整 的 源 代码 将 在 1.7 廊 中 提供 ， 但 目前 不 需要 关注 细节 。)〉 当 到 达 这 
一 行 时 ， 可 以 但 看 该 函数 中 局 部 变量 j 的 值 。 在 GDB 中 使 用 print 命 令 输出 当前 值 。 


(gdb) print j 


在 DDD 中 输出 当前 值 的 方法 更 简单 : 只 要 将 鼠标 指针 在 源 文 本 窗口 中 j 的 任 一 实例 上 移动 ， 
等 1~2 秒 后 就 会 在 一 个 靠近 鼠标 指针 的 小 黄 框 《〈《 称 为 值 提示 ) 中 显示 j 的 值 。 图 1-5 显 示 了 被 但 看 
的 变量 new_y 的 值 。Eclipse 的 显示 方式 也 是 如 此 ， 如 图 1-6 所 示 ， 其 中 碍 询 了 num_y 的 值 。 

第 2 章 将 会 介绍 , 在 GDB 或 DDD 中 , 也 可 以 安排 连续 显示 变量 ， 这 样 就 不 必 反 复 要 求人 得 看 值 。 
DDD 有 一 个 特别 优秀 的 功能 ， 可 以 显示 链表 、 树 以 及 其 他 包含 指针 的 数据 结构 : 单 击 这 种 结构 中 
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任 一 节点 的 回 外 链接 即 可 找到 下 一 个 节操 。 
DDD: /home/p/code/InsCorrect.c j0% 


Vater Prin. 


27 void insert(int new y) 
int. 5 


(num y == 0) { // y empty so far, easy case 


y[0] = new vy; 
return; 


need to insert just before the first y 
element that new y is less than 
for (j}= 0; j < nun y; j++) f{ 
iE jery <ylil) ( 
shift y[j], v[j*1],... rightward 
// before inserting new y 
scoot overíj); 
yl3] = new y; 
return; 


} 
// if we reach this point, NewY > all existing Y elements 
y[num y] = new vy; 


} 


void process data() 


{ 


for (num y = 0; num y < num inputs; num y++) 
// insert new y in the proper place 
// among y[0],...,y[num y-1] 
insert (x[num_y]); 


Breakpoint 1 at 0x8048450: file InsCorrect.c, line 37. 
(gdb) run 12 5 16.160 1 


Breakpoint 1, insert (new y-5) at InsCorrect.c:37 








1-5 在 DDD 中 查看 变量 


[sv Debug - insert sort/ins.c - Eclipse Platform 


File Edit Refactor Navigate Search Run Project Window Help 
Ies SE | canada 


z |E x k 
明 /workspace/insert_sort/Debug/insert_sort (12/13/07 6:33 PM) | Value 
Y [£]insert sort (C/C++ Local Application] 
V È gdb/mi (12/13/07 6:37 PM) (Suspended) 
YV if? Thread [0] (Suspended) 


void process, data() 
{ 


for (num_y = 0; num_y < num_inputs; num_y++) 
// insert new y in the proper place 
],..-,y[num y-1] 
; € num inputs : int 


num. y : int 
9 get args(int, char™) : void 
9 scoot over(int) : void 


then: then/endif not found. 








1-6 在 Eclipse 中 查看 变量 
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1.5.3 在 GDB、DDD 和 Eclipse 中 设置 监视 点 以 应 对 变量 值 的 改变 


监视 点 结合 了 断 点 和 变量 检查 的 概念 。 最 基本 形式 的 监视 点 通知 调试 套 ， 每 当 指 定 变量 的 值 
发 生变 化 时 都 暂停 程序 的 执行 。 
例如 ， 在 程序 执行 期 间 ， 假 设 要 在 变量 z 改 变 值 时 碍 看 程序 的 状态 。 在 GDB 中 ， 可 以 执行 如 


Für. 
(gdb) watch z 


HEF, FAZER ERE, GDB PET. 4EDDD'T, iE CAS fi O H 
单 击 z 的 任 一 实例 来 设置 监视 点 ， 然 后 单 击 DDD 窗 口上 方 的 Watch 疼 标 。 

更 好 的 方法 是 ， 可 以 基于 条 件 表 达 式 来 设置 监视 点 。 例 如 ,假设 要 查找 程序 执行 期 间 z 的 值 
大 于 28 的 第 一 个 位 置 ， 可 以 通过 设置 一 个 基于 表达 式 (z>28) 的 监视 点 来 完成 这 件 事 。 在 GDB 
中 ， 输 入 : 


(gdb) watch (z > 28) 


在 DDD 中 ， 则 是 在 DDD 的 控制 台中 执行 这 一 命令 。 你 一 定 记 得 ，C 语 言 中 表达 式 (z>28) 的 
结果 是 布尔 类 型 ， 计 算得 到 的 值 为 true 或 false， 其 中 false 用 6 表示 ，true 用 任意 非 零 整数 值 表示 ， 
通常 用 1 表示 。 当 z 表 次 变 成 大 于 28 的 值 时 ， 表 达 式 (z>28) 会 从 6 变 成 1，GDB 和 暂停 程序 的 执行 。 

在 Eclipse 中 设置 监视 点 的 方法 为 : 在 源 代 人 码 窗 口中 点 击 忌 标 右键 ， 选 择 Add a Watch 
Expression， 然 后 在 对 话 框 中 填写 适当 的 表达 式 。 

监视 点 对 局 部 变量 的 用 途 一 般 没 有 对 作用 域 更 宽 的 变量 的 用 途 大 , 因为 一 旦 变量 超出 作用 域 
《 即 当 在 其 中 定义 变量 的 函数 结束 时 )， 在 局 部 变量 上 设置 的 监视 点 就 会 被 取消 。 然 而 ，main() 
中 的 局 部 变量 显然 是 一 个 例外 ， 因 为 这 样 的 变量 只 有 程序 执行 完 时 才 会 被 释放 。 


1.5.4 上 下 移动 调用 梳 


在 函数 调用 期 间 ， 与 调用 关联 的 运行 时 信息 存储 在 称 为 栈 帧 (stack frame) 的 内 存 区 域 中 。 
帧 中 包含 函数 的 局 部 变量 的 值 ， 函 数 的 形 参 ， 以 及 调用 访 函 数 的 位 置 的 记录 。 每 次 友 生 函数 调用 
时 ， 都 会 创建 一 个 新 帧 ， 并 将 其 推 到 一 个 系统 维护 的 栈 上 ;， 栈 最 上 方 的 帧 表示 当前 正在 执行 的 函 
数 ， 当 函数 退出 时 ， 这 个 帆 被 弹出 栈 ， 并 且 衫 释放 。 

例如 ， 在 insert() 函 数 中 暂停 示例 程序 insert sort 的 执行 。 当 前 栈 帧 中 的 数据 会 指出 ， 你 通 
过 在 一 个 恰好 位 于 process_data() 函 数 〈 该 函数 调用 insert()) 中 的 特定 位 置 进行 的 函数 调用 到 
达 了 这 个 帧 。 这 个 帆 也 会 存储 insert() 的 唯一 局 部 变量 的 当前 值 ， 稍 后 你 会 发 现 这 个 值 为 j。 

其 他 活动 图 数 调 用 的 栈 帧 将 包含 类 似 的 信息 ， 如 果 你 愿意 ， 也 可 以 奏 看 它们 。 例 如 ， 尽 管 程 
序 的 执行 当前 位 于 insert() 内 ,但 是 你 也 可 能 希望 可 看 调用 栈 中 以 前 的 帧 , 即 奋 看 process_data( ) 
的 帆 。 在 GDB 中 可 以 用 如 下 命令 但 看 以 前 的 巾 。 


(gdb) frame 1 
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当 执 行 GDB 的 frame 命 令 时 ， 当 前 正在 执行 的 水 数 的 帆 补 编写 为 0， 其 父 帧 ( 即 该 函数 的 调用 
ARW) 被 编号 为 1， 父 帆 的 父 帧 被 编号 为 2， 以 此 类 推 。GDB 的 up 命令 将 你 市 到 调用 栈 中 的 下 
一 个 父 帆 〈 例 如 ， 从 巾 0 到 帆 1)，down 则 3 引 各 相反 方 回 。 这 样 的 操作 非常 有 用 ， 因 为 根据 以 前 的 
一 部 分 栈 帧 中 的 局 部 变量 的 值 ， 可 能 发 现 程序 错误 的 线索 。 

裔 历 调 用 栈 不 会 修改 执行 路 人 笃 〈 在 本 例 中 ， 要 执行 的 insert_sort 的 下 一 行 仍然 会 是 insert() 
中 的 当前 行 )， 但 是 它 确 实 允 许 得 看 帧 的 祖先 帆 ， 因 此 可 以 检查 通 癌 当前 帆 的 各 次 函数 调用 的 局 
部 变量 的 值 。 同 样 ， 这 可 以 提示 你 从 何 处 得 找 程序 错误 。 

GDB 的 backtrace 命 令 会 显示 整个 栈 ， 即 当前 存在 的 所 有 帧 的 集合 。 

DDD 中 的 类 似 操作 通过 Status 一 Backtrace 完 成 ， 这 样 做 会 弹出 一 个 显示 所 有 帧 的 窗口 ， 然 后 
可 以 单 击 要 答 看 的 任何 一 个 帧 。DDD 界 面 也 有 Up 和 Down 按 钮 ， 单 击 这 两 个 按钮 可 以 执行 GDB 的 
up 和 down 命 令 。 

在 Eclipse 中 ， 栈 在 Debug 透 视图 本 里 中 连续 可 见 。 在 图 1-7 中 ， 查 看 左上 和 角 的 Debug 选 项 卡 ， 
可 以 看 出 我 们 目前 在 函数 get_args() 的 第 2 帧 中 ， 这 个 函数 是 从 main() 中 的 第 1 帧 调用 的 。 突 出 显 
未 的 古 源 代码 窗口 中 显示 的 那 一 帧 ， 因 此 可 以 通过 在 调用 栈 中 单 击 来 显示 任 一 帧 。 


















































Eile Edit Refactor Navigate Search Run Project Window Help 
| ti B |7 O- Ay | # | Bir SI € Gr o7 





"v a Thread [0] (Suspended) Value 


三 get args) /workspace/insert_sort/ins.c:16 0x080483c 4 
l Oxbfc224c4 











for (i = 0; i < num inputs; i++) 
printf("%d\n",y[i]); 





( get args(argc,argv); € num inputs : int 
process. data(); 


int main(int argc, char ** argv) 
print. results(); 


9 get args(int, char) : void 
9 scoot over(int) : void 








ee 0|» EARN 
El Console 3: Ô Tasks 区 Problems | Memory | B X &|& a ee) r* Be rji" B 


insert. sort [C/C++ Local Application] /workspace/insert_sort/D: nsert. sort (12/13/07 7:39 PM) 
then: then/endif not found. 
(f ——— eJ 


图 1-7 ”在 Eclipse 的 栈 中 移动 














1.6 联机 帮助 
在 GDB 中 ， 可 以 通过 help 命 令 访问 文档 。 例 如 ， 


(gdb) help breakpoints 


图 灵 社区 会 员 cindy282694 专 享 尊重 版 权 





16 第 13x 预备 知识 


将 显示 关于 断 点 的 文档 。 不 带 参数 的 GDB 命 令 help 可 显示 一 个 菜单 ,， 列 出 可 用 来 作为 help 的 参数 


的 命令 类 别 。 





在 DDD 和 Eclipse 中 ， 可 通过 单 击 Help 获 得 大 量 信息 。 


1.7 Wei 


PF. 


现在 我 们 将 提供 一 个 完整 的 调试 会 话 。 前 面 说 过 ， 示 例 程 序 在 源 文件 ins.c 中 ， 它 实现 插入 排 
当然 ， 这 种 排序 方法 效率 不 高 ， 但 是 其 代码 比较 简单 ， 有 利于 说 明 调 试 操作 ， 代 码 如 下 。 








// 


// insertion sort, several errors 

// 

// usage: insert sort numi num2 num3 ..., where the numi are the numbers to 
// be sorted 


int x[10], // input array 
y[10], // workspace array 
num inputs, // length of input array 
num y = 0; // current number of elements in y 


void get args(int ac, char *xav) 
( inti; 


num inputs - ac - 1; 
for (i = 0; i « num inputs; i++) 
x[i] = atoi(av[i+1]); 
1 


void scoot over(int jj) 
{ int k; 


void insert(int new y) 
t int j; 


if (num y = 0) { // y empty so far, easy case 
y[o] = new y; 
return; 

} 

// need to insert just before the first y 

// element that new y is less than 
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for (j = 0; j < num y; je) { 
if (new y < ylj]) 1 
// shift y[j], y[j+i],... rightward 
// before inserting new y 
scoot over(j); 


vlail = new v: 
yiJ] = new BT 





return; 
} 
} 
} 
void process data() 
{ 
for (num y = 0; num y < num inputs; num yc) 
// insert new y in the proper place 
// among y[0],...,y[num y-1] 
insert(x[num y]); 
} 


void print results() 
i inti; 


for (i = 0; i « num inputs; i++) 
printf("dNn",y[i]); 
j 


int main(int argc, char ** argv) 
{ get_args(argc, argv); 

process data(); 

print results(); 


} 


下 和 面 是 这 段 程 序 的 一 个 伪 人 码 描述 。 用 call 语 句 表示 函数 调用 ， 各 个 函数 的 伪 人 码 在 这 些 调用 下 
面 缩 进 显示 。 


call main(): 
set y array to empty 
call get args(): 
get num inputs numbers x[i] from command line 





call process data(): 
for i - 1 to num inputs 
call insert(x[i]): 
new y - x[i] 
find first y[j] for which new y < y[jl 
call scoot over(j): 
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shift y[j], y[j*1], ... to right, 
to make room for new y 
set y[j] = new y 


让 我 们 编 详 并 运行 代码 。 


$ gcc -g -Wall -o insert sort ins.c 





注意 ,在 GCC 中 可 以 用 -g 选 项 让 编译 器 将 符号 表 ( 即 对 应 于 程序 的 变量 和 代码 行 的 内 存 地 址 
列表 ) 保存 在 生成 的 可 执行 文件 (这 里 是 insert sort) 中 。 这 是 一 个 绝对 必要 的 步 又， 这 样 才 能 
在 调试 会 话 过 程 中 引用 源 代码 中 的 变量 名 和 行 写 。 如 果 没 有 这 一 步 ( 要 是 使 用 的 编 详 右 不 是 GCC， 
则 必须 做 一 些 类 似 的 操作 )， 吏 不 能 要 求 调试 问 “ 在 第 30 行 处 俘 止 ”或 者 “输出 x 的 值 ” 

现在 让 我 们 运行 该 程序 。 根 据 1.3.3 节 介绍 的 从 简单 工作 开始 调试 的 原则 ， 首 先 尝 试 排序 一 个 
只 有 两 个 数 的 列表 。 


$ insert sort 12 5 
(execution halted by user hitting ctrl-C) 




















该 程序 没有 终止 ， 也 没有 输出 任何 内 容 。 它 显然 进入 了 一 个 无 限 循 环 ， 必 须 按 下 Ctrl+C 组 合 
刍 来 终止 这 个 循环 。 瞧 无 疑问 ， 肯 定 有 什么 地 方 出 了 问题 。 

在 下 面 几 节 中 , 我 们 首先 用 GDB 提 供 一 个 调试 会 话 来 调试 这 个 有 错误 的 程序 ,然后 讨论 如 何 
用 DDD 和 Eclipse 进行 这 种 调试 。 
1.7.1 GDB 方 法 


为 了 跟踪 第 一 个 程序 错误 ， 在 GDB 中 执行 这 个 程序 ， 并 在 按 Ctrl+C 组 合 键 挂 起 程序 之 前 让 和 它 
运行 一 会 儿 。 然 后 看 看 这 时 停留 在 何 处 。 用 这 种 方式 可 以 确定 无 限 循环 的 位 置 。 
首先 ， 对 zsert sort 局 动 GDB 调 试 絮 。 




















$ gdb insert sort -tui 








X HT BERE NAHE P o 


63 { get args(argc,argv); 
64 process data(); 

65 print results(); 

66 ) 


69 
File: ins.c Procedure: ?? Line: ?? pc: ?? 











上 面 的 子 窗口 显示 了 部 分 源 代 码 , 在 下 面 的 子 窗口 中 有 等 每 输入 命令 的 GDB 提 示 和 从 ,还 有 一 
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条 GDB 欢 迎 消 县 ， 为 了 简化 起 见 ， 我 们 省 略 了 这 条 消息 。 

如 果 在 调用 GDB 时 没有 请 求 TUI 模 式 ， 那么 只 会 收 到 欢迎 消息 和 GDB 提 示 符 ， 不 会 出 现 上 面 
的 程序 源 代 码 子 窗口 。 可 以 用 GDB 的 命令 CtrlHX+A 组 合 键 进 入 TUI 模 式 。 这 个 命令 用 来 打开 或 关 
闭 TUI 模 式 。 如 果 你 愿意 ， 可 以 用 该 命令 临时 离开 TUI 模 式 ， 从 而 更 方便 地 阅读 GDB 的 联机 帮助 ， 
或 者 在 同一 个 屏幕 上 和 查看 用 过 的 更 多 GDB 命 令 。 

现在 从 GDB 中 执行 un 命令 以 及 程序 的 命令 行 参数 来 运行 该 程序 ， 然 后 按 Ctrl+C 组 合 键 挂 起 
它 。 屏 幕 现 在 如 下 所 示 。 

















46 

47 void process data() 

48 { 

49 for (num y = 0; num y < num inputs; num y++) 


50 // insert new y in the proper place 
51 // among y[0],...,y[num y-1] 
» 52 insert(x[num y]); 
53 i 
54 
55 void print results() 
56 { int i; 


No 


58 for (i = 0; i < num inputs; i++) 
59 printf("%d\n" ,y[il); 
60 } . 
File: ins.c Procedure: process data Line: 52 pc: 0x8048483 


(gdb) run 12 5 
Starting program: /debug/insert sort 12 5 


Program received signal SIGINT, Interrupt. 
0x08048483 in process data () at ins.c:52 
(gdb) 


该 屏幕 表明 ， 当 停止 程序 时 ，insert sort 在 函数 process_data() 中 ， 即 将 执行 源 文件 ins.c 的 第 52 行 。 

我 们 随机 按 下 Ctrlt+C 组 合 键 ， 并 在 代码 中 的 任意 位 置 停止 。 有 时 最 好 挂 起 并 重 局 停止 了 两 到 
三 次 啊 应 的 程序 ， 方 法 是 在 两 次 按 下 Ctrl+C 组 合 键 之 间 执 行 continue 命 令 ， 以 便 碍 看 每 次 是 在 何 
处 停止 的 。 

现在 ， 第 52 行 是 从 第 49 行 开始 的 循环 的 一 部 分 。 这 个 循环 是 否 为 无 限 循环 呢 ? 这 个 循环 似乎 
不 应 当 无 限 地 循环 ,但 是 确认 原则 表明 ， 应 该 验证 一 下 ,不 要 想当然 。 如 果 因 为 你 不 知 何故 没有 
正确 地 设置 变量 num_y 的 上 边界 ， 导 致 循环 没有 终止 ， 那 么 当 程序 运行 了 一 段 时 间 后 ，num_y 的 值 
将 相当 大 。 是 吧 ? 《同样 ， 看 上 去 似乎 不 会 ， 但 是 需要 确认 一 下 。) 下面 我 们 查看 一 下 GDB 输 出 
的 num_y 值 。 
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(gdb) print num y 
31-1 


xx — £V 4t t xe HA num_yH EAL. $TERAS EXC GE PRES GDB AGT HA He C$1. 
$2、$3 等 表示 的 值 统称 为 调试 会 话 的 值 历 史 。 后 面 的 章 节 中 你 会 看 到 ,会 话 的 值 历 史 非 党 有 用 .。) 
因此 我 们 似乎 仅 在 该 循环 的 第 二 个 迭代 上 ， 即 第 49 行 。 如 果 这 个 循环 是 无 限 循 环 ， 那 么 到 这 时 为 
LEIA A LEE IER 

那么 ,让 我 们 仔细 看 一 下 当 num_y 为 1 时 发 生 的 事情 。 通知 GDB 在 循环 的 第 二 次 迭代 期 间 ， 在 
第 49 行 处 的 insert() 中 停止 ， 以 便 查 看 情况 ， 和 尝试 找 出 程序 这 时 在 这 个 位 置 出 了 什么 问题 。 
(gdb) break 30 


Breakpoint 1 at Ox80483fc: file ins.c, line 30. 
(gdb) condition 1 num y==1 


























第 一 个 命令 A 另外 ， 可 以 通过 命令 break 
P 即 在 insert() 的 第 一 行 处 中 断 〈 这 里 是 第 30 行 )。 后 一 种 形式 有 一 个 优点 : 
Us Wr 
点 ， 而 不 是 用 行 号 指定 ， 则 断 点 仍然 有 效 。 

break 命 令 一 般 会 使 得 每 次 程序 执行 到 指定 行 时 都 会 暂停 。 然 而 ， 这 里 的 第 二 个 命令 
condition 1 num_y==1 使 得 该 断 点 成 为 有 条 件 的 断 点 : 只 有 当 满 足 条 件 num_y==1 时 ，GDB 才 会 在 
断 点 1 处 暂停 程序 的 执行 

注意 ， 与 接受 行 号 《或 函数 名 ) 的 break 命 令 不 同 ，condition 接 受 断 点 号 。 总 是 可 以 用 命令 

en D RON frd sr ks A BS o (该 命令 也 提供 了 其 他 有 用 信息 ， 比 如 到 目前 为 止 遇 到 
各 个 断 点 的 次 数 。) 

用 break if 可 以 将 break 和 condition 命 令 组 合成 一 个 步骤 ， 如 下 所 示 。 














(gdb) break 30 if num y-- 


然后 用 run 命 令 再 次 运行 程序 。 如 果 要 重用 老 的 命令 行 参 数 ， 束 不必 再 次 指定 命令 行 参 数 。 
这 里 就 是 这 种 情况 ， 可 以 简单 地 输入 run。 由 于 程序 已 经 在 运行 ， 因 此 GDB 询 问 是 否 希 望 重新 从 
头 开 始 ， 请 回答 “是 ” 





























屏 攻 这 时 将 如 下 押 示 。 
24 ylk] = ylk-1]; 
25 } 
26 
27 void insert(int new y) 
28 { int j; 
29 
*> 30 if (num y = 0) { // y empty so far, easy case 
31 y[o] = new_y; 
32 return; 
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33 } 
34 // need to insert just before the first y a 
35 // element that new y is less than 
36 for (j = 0; j < nm y; j++) { 
37 if (new y < y[j]) { 
38 // shift y[j], y[jtt],... rightward 
File: ins.c Procedure: insert Line: 30 pc: 0x80483fc 


(gdb) condition 1 num y--1 

(gdb) run 

The program being debugged has been started already. 
Start it from the beginning? (y or n) 

Starting program: /debug/insert sort 12 5 


Breakpoint 1, insert (new y=5) at ins.c:30 
(gdb) 


我 们 再 次 应 用 确认 原则 : 因为 num_y 为 1， 所 以 应 跳 过 第 31 行 ， 直 接 执行 第 36 行 。 但 是 我 们 需 
要 确认 这 一 点 ， 因 此 执行 next 命 令 来 继续 执行 下 一 行 。 


24 ylk] = y[k-1]; 
25 } 
26 
27 void insert(int new y) 
28 { int j; 
29 
* 30 if (num y = 0) ( // y empty so far, easy case 
31 y[o] = new y; 
32 return; 
33 } 
34 // need to insert just before the first y 
35 // element that new y is less than 
» 36 for (j = 0; j < num y; j++) { 
37 if (new y < y[j]) { 
38 // shift y[j], yLjr1],... rightward 
File: ins.c Procedure: insert Line: 36 pc: 0x8048406 
(gdb) run 


The program being debugged has been started already. 
Start it from the beginning? (y or n) 
Starting program: /debug/insert sort 12 5 


Breakpoint 1, insert (new y-5) at ins.c:30 


(gdb) next 
(gdb) 
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上 和 面 的 子 窗口 中 的 箭头 现在 位 于 第 36 行 ， 因 此 确认 了 我 们 的 预料 ， 我 们 确实 跳 过 了 第 31 行 。 
现在 让 我 们 继续 单 步调 试 程序 ， 依 次 确认 关于 这 段 代码 的 假设 。 由 于 现在 位 于 循环 的 开 尖 ， 因 此 
再 执行 儿 次 next 命 令 来 逐 行 租 看 循环 的 进展 。 


39 // before inserting new y 
40 scoot over(j); 
41 y[j] = new y; 
42 return; 
43 } 
44 } 

> 45 } 
46 
47 void process data() 
48 { 
49 for (num y = 0; num y < num inputs; num y++) 
50 // insert new y in the proper place 
51 // among y[0],...,y[num y-1] 
52 insert(x[num y]); 
53 } 

File: ins.c Procedure: insert Line: 45 pc: 0x804844d 


The program being debugged has been started already. 
Start it from the beginning? (y or n) 
Starting program: /debug/insert_sort 12 5 


Breakpoint 1, insert (new y=5) at ins.c:30 
(gdb) next 

(gdb) next 

(gdb) 


看 一 下 上 面 的 子 窗 口中 鼻头 现在 位 于 何 处 一 一 我 们 二 接 从 第 37 行 跳 到 了 第 45$ 行 ! 这 种 情况 让 
AKE Th AMA OEE AMT» MERWE, LIRARE, AA ett oR 
于 程序 错误 在 何 处 的 线索 。 

该 循环 在 第 36 行 处 根本 不 执行 迭代 的 唯一 原因 是 : 即使 当 j 为 0 时 ， 第 36 行 的 条 件 j<num_y 也 
不 成 立 。 然 而 你 知道 (全 少 你 认为 你 知道 )num_y 为 1， 因 为 在 该 断 点 上 施加 了 条 件 num_y==1 后 ， 




















你 现在 位 于 该 函数 中 。 同 样 ， 还 没有 人 确认 这 一 点 。 现 在 检查 一 下 。 
(gdb) print num y 
$2 = 0 


本 无 颖 问 ， 虽 然 进 入 insert() 时 不 满足 num_y==1 这 一 条 件 ， 但 是 显然 从 那 时 起 num_y 已 经 改 
变 。 当 进入 这 个 函数 后 ，num_y 变 成 了 0。 但 是 如 何 变 的 呢 ? 
前 面 说 过 ， 确 认 原 则 不 会 告诉 你 程序 错误 是 什么 ,但 是 它 提供 了 程序 错误 可 能 位 于 何 处 的 线 
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BR, 在 本 例 中 ,现在 发 现 了 程序 错误 的 位 置 在 第 30 行 和 第 36 行 之 间 的 某 处 。 可 以 进一步 缩小 其 范 
围 ， 因 为 你 看 到 第 31 行 到 第 33 行 被 跳 过 了 ， 第 34 行 到 第 35 行 是 注释 。 换 言 之 ， 要 么 在 第 30 行 ， 要 
么 在 第 36 行 ，num_y 中 的 值 发 生 了 神秘 的 变化 。 

在 进行 短暂 的 休息 (这 往往 是 最 佳 调 试 策略 !) 之 后 , 我 们 突然 意识 到 这 个 问题 是 C 程 序 员 新 
手 常 犯 的 一 个 典型 错误 (有 经 验 的 程序 员 有 时 也 会 狼 儿 地 犯 这 个 错误 ): 在 第 30 行 我 们 用 =， 而 不 
是 ==， 把 一 次 相等 测试 变 成 了 一 个 赋值 操作 。 

明日 了 吗 ? 因 为 这 个 原因 ， 所 以 产生 了 无 限 循环 。 第 30 行 的 错误 产生 了 一 种 无 休止 的 拉锯 式 
情况 ， 第 49 行 的 num_y++ 部 分 让 num_y 反 复 地 从 0 递增 到 1， 而 第 30 行 的 错误 反复 地 将 该 变量 的 值 又 
设置 为 0。 

因此 我 们 修复 了 这 个 比较 丢脸 的 程序 错误 ， 重 新 编译 ， 并 再 次 运行 程序 。 

$ insert sort 12 5 


5 
0 


虽然 我 们 不 再 有 无 限 循环 了 ， 但 是 仍然 没有 得 到 正确 的 输出 。 

从 前 面 描述 程序 功能 的 伪 码 中 可 以 看 出 : 最 初 数组 y 应 该 是 空 的 ， 循 环 在 第 49 行 的 第 一 次 迭 
代 应 该 将 12 放 到 y[e6] 中 ， 然 后 在 第 二 次 达 代 中 12 应 移动 一 个 数组 位 首 ， 为 插入 5 腾 出 空间 。 然 而 ， 
SSE ES PTH J 12. 

问题 出 在 第 三 个 数 子 5) E, EMA RRR RC AA Ba ee ae PE PE 
GDB 会 话 中 ， 而 没有 在 发 现 和 修复 第 一 个 程序 错误 后 退出 GDB， 上 所 以 我 们 以 前 设置 的 断 点 及 其 
条 件 现在 仍然 有 效 。 因 此 只 要 再 次 运行 程序 ， 当 程序 开始 处 理 第 二 个 输入 时 停止。 













































































24 ylk] = y[k-1]; 
25 } 
26 
27 void insert(int new y) 
28 i int j; 
29 
*> 30 if (num y == 0) { // y empty so far, easy case 
31 y[0] = new y; 
32 return; 
33 } 
34 // need to insert just before the first y 
35 // element that new y is less than 
36 for (j = 0; j < nm y; j+) { 
37 if (new y < y[j]) { 
38 // shift y[j], y[j*1],... rightward 
File: ins.c Procedure: insert Line: 30 pc: 0x80483fc 


The program being debugged has been started already. 
Start it from the beginning? (y or n) 
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"/debug/insert sort' has changed; re-reading symbols. 
Starting program: /debug/insert sort 12 5 


Breakpoint 1, insert (new y-5) at ins.c:30 
(gdb) 


注意 如 下 这 行 代 码 。 
"/debug/insert sort' has changed; re-reading symbols. 


iU 7RGDB ACAD] gr VE Y FEF, 在 运行 程序 之 前 目 动 重新 加 载 了 新 的 三 分 表 和 新 的 符 
写 表 。 

我 们 在 重新 编译 程序 之 前 仍然 不 必 退 出 GDB .这样 做 之 所 以 提供 了 很 大 的 方便 ,有 儿 个 原因 。 
第 一 ， 不 需要 重新 指出 命令 行 参数 ， 只 要 键入 run 重 新 运行 程序 即 可 。 其 次 ，GDB 保 留 了 你 设置 
的 断 点 ， 因 此 不 需要 再 次 键入 它 。 虽 然 这 里 只 有 一 个 断 点 ， 但 很 多 情况 下 会 有 多 个 断 点 ， 因 此 这 
样 省 了 不 少 事 。 这 些 便利 减少 了 键入 操作 ， 更 重要 的 是 它们 减少 了 对 机 械 操 作 的 分 心 ， 可 以 更 好 
HK AH J SEP SE bas ali Eo 

同样 ， 在 调试 会 话 期 间 不 要 退出 再 重 局 文本 编辑 占 ， 这 件 事 也 会 分 心 而 且 浪 费时 间 。 只 要 将 
文本 编辑 器 放 在 一 个 窗口 中 ，GDB (或 DDD)〉 放 在 为 一 个 窗口 中 ， 用 第 三 个 窗口 调试 程序 即 可 。 

现在 让 我 们 再 次 尝试 单 步 调试 代码 。 与 以 前 一 样 ， 程序 应 该 跳 过 第 31 行 ,但 是 与 前 面 的 情况 
不 同 的 是 ， 这 次 它 有 布 望 到 达 第 37 行 。 我 们 通过 执行 next 命 令 两 次 来 检举 这 一 氮 。 















































31 y[O] = new y; 
32 return; 
33 } 
34 // need to insert just before the first y 
35 // element that new y is less than 
36 for (j = 0; j < num y; j++) { 
> 37 if (new y < y[j]) { 
38 // shift y[j], y[j+1],... rightward 
39 // before inserting new y 
40 scoot_over(j); 
41 y[j] = new y; 
42 return; 
43 ) 
44 } 
45 } 
File: ins.c Procedure: insert Line: 37 pc: 0x8048423 


"/debug/insert sort' has changed; re-reading symbols. 


cL. i aa, ec veg 


— A n p 2 fale E art o Dm aa^ r 
Starting program: /debug/insert sort 12 5 


Breakpoint 1, insert (new y-5) at ins.c:30 
(gdb) next 
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(gdb) next 
(gdb) 


我 们 真 的 到 达 了 第 37 行 。 

这 时 ， 我 们 认为 第 37 行 的 计 中 的 条 件 应 当成 这， 因为 new_y 应 为 5， 并 且 第 一 次 迭代 结束 y[e8] 
应 为 12。GDB 的 输出 确认 了 前 一 个 假设 ， 下 面 检 查 后 一 个 假设 。 

(gdb) print y[o] 

$3 - 12 

这 个 假设 也 得 到 了 确认 , 然后 执行 next 命 令 , 它 将 你 带 a 到 第 40 行 ,我 们 预期 函数 scoot_over() 
将 12 移 到 下 一 个 数组 位 置 处 ， 为 $ 腾 出 空间 。 你 应 该 得 看 它 有 没有 完成 这 件 事 。 这 时 面临 一 个 重 
要 选择 。 你 可 以 再 次 执行 next 命 令 ， 使 得 GDB 在 第 41 行 处 俘 止 ;函数 scoot _over() 会 被 执行， 但 
是 GDB 不 会 在 该 函数 中 人 停止。 然而， 如果 你 执行 的 是 step 命 令 ，GDB 就 会 在 第 23 行 停止 ， 这 样 
会 允许 在 scoot_over() 中 单 步 调试 。 

采用 1.3.3 节 介绍 的 目 顶 回 下 的 调试 方法 ， 我们 在 第 40 行 选择 next 命 令 ， 而 不 是 step 命 令 。 当 
GDB 在 第 41 行 停止 时 ， 可 以 看 一 下 y 值 ， 检 得 函数 有 没有 正确 地 完成 其 工作 。 如 果 确 认 了 这 一 假 
设 ， 就 不 必 浪 费时 间 查 看 对 修复 当前 程序 错误 没有 用 处 的 冰 数 scoot_over() 的 详细 操作 。 如 果 没 
有 能 够 确认 , 可 以 再 次 在 调试 器 中 运行 该 程序 , 并 使 用 step 进 入 函数 , 以便 检查 函数 的 详细 操作 ， 
以 期 确定 何 处 出 了 问题 。 

因此 ， 当 达到 第 40 行 时 ， 键 入 next， 产 生 : 









































31 ylo] = new y; 
32 return; 
33 } 
34 // need to insert just before the first y 
35 // element that new y is less than 
36 for (j = 0; j < num y; jt) { 
37 if (new y < y[3]) 1 
38 // shift y[j], y[j+1],... rightward 
39 // before inserting new_y 
40 scoot over(j); 
> 41 y[j] = new y; 
42 return; 
43 ) 
44 } 
45 } 
File: ins.c Procedure: insert Line: 41 pc: 0x8048440 
(gdb) next 
(gdb) next 
(gdb) 
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scoot over() 有 没有 正确 地 移动 12? 让 我 们 看 一 下 。 


(gdb) print y 
$4 = (12, 0, 0, 0, 0, 0, 0, 0, 0, 0} 


显然 没有 。 问 题 实 际 上 出 现在 scoot_over() 中 。 我 们 删除 insert() 开 头 的 断 点 ， 并 在 
scoot_over() 中 放置 一 个 断 点 ， 同 样 采 用 一 个 可 在 第 49 行 的 第 二 次 欠 代 时 停止 的 条 件 。 


(gdb) clea 30 

Deleted breakpoint 1 

(gdb) break 23 

Breakpoint 2 at 0x80483c3: file ins.c, line 23. 
(gdb) condition 2 num y--1 











现在 再 次 运行 程序 。 


15 num inputs = ac - 1; 
16 for (i = 0; i < num inputs; i++) 
17 x[i] = atoi(av[i+1]); 
18 } 
19 
20 void scoot_over(int jj) 
21 { int k; 
22 
*» 23 for (k = num y-1; k > jj; k++) 
24 ylk] = y[k-1]; 
25 i 
26 
27 void insert(int new y) 
28 { int j; 
29 
File: ins.c Procedure: scoot over Line: 23 pc: 0x80483c3 


(gdb) condition 2 num y--1 

(gdb) run 

The program being debugged has been started already. 
Start it from the beginning? (y or n) 

Starting program: /debug/insert sort 12 5 


Breakpoint 2, scoot over (jj=0) at ins.c:23 
(gdb) 


FRR EEA UR A JU]: 想 一 下 你 预期 会 发 生 什 么 情况 ,然后 尝试 确认 确实 发 生 了 这 种 情况 。 在 
这 个 例子 中 ， 我 们 认为 函数 会 将 12 移 到 数组 y 中 的 下 一 个 位 置 ， 这 总 味 看 第 23 行 的 循环 应 当 恰 好 
通过 一 次 迭代 。 让 我 们 通过 重复 执行 next 命 令 来 单 步 调试 该 程序 ， 以 便 确 认 这 种 预期 。 
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15 num inputs = ac - 1; 
16 for (i = 0; i« num inputs; i++) 
17 x[i] = atoi(av[i+1]); 
18 } 
19 
20 void scoot_over(int jj) 
21 { int k; 
22 

* 23 for (k = num y-1; k > jj; k++) 
24 y[k] = y[k-1]; 

» 25 ) 

26 
27 void insert(int new y) 
28 { int j; 
29 

File: ins.c Procedure: scoot over Line: 25 pc: 0x80483f1 


The program being debugged has been started already. 
Start it from the beginning? (y or n) 
Starting program: /debug/insert_sort 12 5 


Breakpoint 2, scoot_over (jj=0) at ins.c:23 
(gdb) next 
(gdb) next 


(gdb) 


这 里 我 们 再 次 恢 订 地 发 现 : 我 们 现在 位 于 第 25 行 ,其 全 部 没 有 页 到 第 24 行 一 一 循环 没有 执行 
从 代 ， 我 们 预期 会 执行 的 迭代 一 次 也 没有 执行 。 显 然 第 23 行 有 一 个 程序 错误 。 

正如 前 面 那 个 出 乎 意料 地 没有 对 循环 体 执 行 一 次 欠 代 的 循环 , 肯定 是 在 循环 的 一 开始 就 没有 
满足 循环 条 件 。 这 里 是 不 是 这 种 情况 呢 ? 第 23 行 的 循环 条 件 是 k>jj。 我 们 从 这 一 行 中 还 知道 了 k 
的 初始 值 是 num_y-1， 我 们 从 断 点 条 件 知道 后 者 的 量 为 0。 了 最 后 ，GDB 屏 关 告 诉 我 们 ，j 订 为 0。 
此 当 循 环 开始 时 条 件 k>jj 没 有 得 到 满足 。 

因此 ， 我 们 要 么 错误 地 指定 了 循环 条 件 k>jj， 要 么 错误 初始 化 成 了 k=num_y-1。 我 们 认为 在 
循环 的 第 一 次 也 是 唯一 的 一 次 欠 代 中 , 应 将 12 从 y[8] 移 到 y[1]( 即 第 24 行 应 当 在 k=1 时 已 经 执行 )， 
我 们 蕊 识 到 循环 初始 化 错 了 ， 应 该 是 k=num_y。 

修复 这 个 错误 ， 重 新 编 详 程 序 ， 再 次 运行 程序 〈 在 GDB 之 外 )。 

$ insert sort 12 5 

Segmentation fault 


"uer FEED BRIAN CVE A FEIN, MERRER COA EKG EAR SP ZS Do Jak ASE 
征 由 于 数组 索引 超出 了 边界 ， 或 者 采用 了 错误 的 指针 值 。 段 错误 也 可 能 由 没有 显 式 地 包含 指针 或 
数组 变量 的 内 存 引 用 产生 。 这 种 情况 可 以 从 C 程 序 员 蜗 犯 的 另 一 个 典型 错误 中 看 出 ， 比 如 ， 古 记 
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在 用 按 引 用 调用 传递 的 函数 形 参 中 加 上 &， 写 成 了 : 

scanf("%d" ,x); 
而 不 是 

scanf(" Xd" ,&x); 

Ar. GDBEKDDDIX FF AY JAVA LH. H E BEM oe f AUS ub ig R3 45 E BEE, 

但 是 对 于 段 错 误 ， 调 试 工具 提供 了 额外 、 切 实 、 即 时 的 帮助 : 它 指 出 在 程序 中 何 处 出 现 了 错 
IRo 

为 了 利用 这 一 点 ， 需 要 在 GDB 中 运行 insert sort， 并 重 现 段 错 误 。 首 先 ， 删 除 断 点 。 正 如 六 
面 见 到 的 ， 要 做 到 这 一 点 ， 需 要 给 出 断 点 的 行 号 。 你 可 能 已 经 记 住 了 行 写 , 但 是 要 但 找 起 来 也 很 
容易 : 可 以 深 动 TUI 窗 口 ( 用 上 下 季 头 键 )， 会 找 用 星 写 标记 的 行 ， 或 者 用 GDB 的 info break 命 
令 来 人 查找。 然后 用 clear 命 令 删 除 断 点 。 


(gdb) clear 30 


























现在 再 次 在 GDB 中 运行 程序 。 


19 
20 void scoot over(int jj) 
21 { int k; 
22 
23 for (k = num y; k > jj; k++) 

» 24 ylk] = y[k-1]; 
25 } 
26 
27 void insert(int new y) 
28 { int j; 
29 
30 if (num y == 0) { // y empty so far, easy case 
31 y[0] = new y; 

File: ins.c Procedure: scoot_over Line: 24 pc: 0x8048538 


Start it from the beginning? (y or n) 


"/debug/insert sort' has changed; re-reading symbols. 
Starting program: /debug/insert sort 12 5 


Program received signal SIGSEGV, Segmentation fault. 
0x08048538 in scoot over (jj=0) at ins.c:24 
(gdb) 


不 出 所 料 , GDB 告 诉 了 我 们 段 错 误 发 生 的 确切 位 置 , 即 在 第 24 行 , 肯定 与 一 个 数组 索引 有 大 ， 
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也 就 是 k。 要 么 是 k 太 大 了 ， 超 过 了 y 中 的 数组 个 数 ， 要 么 k-1 是 负数 。 显 然 我 们 需要 做 的 第 一 件 避 
古人 确定 k 的 值 。 


(gdb) print k 
$4 = 584 


可 以 看 出 ， 代 码 规 定 y 只 能 有 10 个 元 系 ， 因 此 k 的 值 实际 上 远 远 超过 了 这 一 范围 。 我 们 现在 必 
须 跟 躁 原因 。 

首先， 硝 定 段 错误 发 生 时 这 个 重要 循环 和 友 代 在 第 49 行 。 

(gdb) print num y 

$5 = 1 


ERG X E SB RIERA IRI ELLA S AT ER scoot. over() 时 发 生 了 段 错 误 。 换 言 之 ， 并 
不 是 前 儿 次 调用 scoot_over() 时 第 23 行 工作 得 很 好 而 在 以 后 调用 时 失败 了 。 这 行 代码 仍然 有 一 些 
根本 性 的 错误 。 由 于 只 剩 下 唯一 的 候选 语句 

















k++ 


C SL Bj t tor IK — 11 BECA RAO. KE Ta) ei ee HE. Fl, EE, 3X4] 
意识 到 原来 这 里 应 该 是 k- -。 

修复 这 行 代 码 并 再 次 重新 编译 运行 程序 。 

$ insert sort 12 5 


5 
12 


现在 已 经 有 了 进步 ! 但 是 该 程序 对 于 较 大 的 数据 集 是 否 运行 正确 呢 ? LEAN F o 


$ insert sort 12 5 19 22 6 1 
1 
5 
6 
12 
0 
0 


现在 已 经 看 到 了 成 功 的 曙光。 大 多 数 数 组 被 正确 地 排序 。 该 列表 中 的 第 一 个 没有 正确 排序 的 
数字 是 19， 因 此 在 第 36 行 设置 一 个 断 点 ， 这 次 采用 条 件 new_ y == 19. © 
(gdb) b 36 


Breakpoint 3 at 0x804840d: file ins.c, line 36. 
(gdb) cond 3 new y--19 
































C 从 这 时 起 使 用 命令 的 常用 缩写 。 比 如 ，b 表 示 break，i b 表 示 info break，cond 表 示 condition，r 表 示 Fun，n 
表示 next，s 表 示 step，c 表 示 continue，p 表 示 print，bt 表 示 backtrace。 
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然后 在 GDB 中 运行 程序 (一 定 要 使 用 相同 的 参数 ，12 5 19 2261). MAJA, HOA 





到 目前 为 止 数 组 y 已 经 被 正确 地 排序 : 


31 y[0] = new y; 
32 return; 
33 } 
34 // need to insert just before the first y 
35 // element that new y is less than 
*» 36 for (j = 0; j < num y; j++) { 
37 if (new y < y[j]) 1 
38 // shift y[j], y[j+1],... rightward 
39 // before inserting new y 
40 scoot over(j); 
41 ylj] = new y; 
42 return; 
43 } 
File: ins.c Procedure: insert Line: 36 pc: 0x8048564 


Start it from the beginning? (y or n) 
Starting program: /debug/insert_sort 12 5 19 22 6 1 


Breakpoint 2, insert (new y=19) at ins.c:36 
(gdb) p y 
$1 = {55 12, 0, 0, 0, 0, 0, 0, O, 0j 
(gdb) 


到 目前 为 目 , HWE. 现在 让 我 们 尝试 确定 程序 如 何 处 理 19。 我 们 仍然 一 次 一 行 代码 进行 
调试 。 注意， 因为 19 既 不 小 于 5， 也 不 小 于 12， 所 以 我 们 没有 期 望 第 37 行 的 if 语 句 中 的 条 件 成 立 。 








当 遇 到 n 儿 次 以 后 ， 我 们 发 现 目 己 位 于 第 45 行 上 : 


35 // element that new y is less than 

* 36 for (j = 0; j < num y; j++) { 
37 if (new y < y[j]) 1 
38 // shift y[j], ylj+1],... rightward 
39 // before inserting new y 
40 scoot_over(j); 
41 y[j] = new y; 
42 return; 
43 } 
44 } 

> 45 } 

46 
47 void process data() 

File: ins.c Procedure: insert Line: 45 pc: 0x80485c4 
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(gdb) n 
(gdb) n 
(gdb) n 
(gdb) n 
(gdb) n 
(gdb) 


我 们 在 第 45 行 上 ， 打 算 退 出 循环 ,根本 没有 对 19 做 任何 事情 ! 进一步 检查 结 朱 表明 ， 我 们 的 
代码 没 有 禾 访 一 个 重要 情况 ， 也 就 是 new_y 大 于 我 们 目前 为 止 处 理 的 元 到 的 情况 ， 第 34 行 和 第 35 
行 的 注释 还 揭露 了 一 个 玩 漏 : 


// need to insert just before the first y 
// element that new y is less than 


为 了 处 理 这 种 情况 ， 在 第 44 行 后 面 诺 加 如 下 代码 ; 


// one more case: new y » all existing y elements 
y[num y] = new y; 


然后 重新 编译 并 再 次 运行 程序 : 


$ insert sort 12 5 19226 1 


























22 
这 是 正确 的 输出 ， 接 下 来 的 测试 也 给 出 了 正确 的 结 
1.7.2 同样 的 会 话 在 DDD 中 的 情况 


本 节 介 绍 上 面 的 GDB 会 话 在 DDD 中 是 什么 情况 。 当然 不 需要 重复 所 有 步骤 , 只 要 关注 与 GDB 
不 同 的 内 容 即 可 。 
DDD 的 启动 与 GDB 相 似 。 用 GCC 编译 源 代 码 ， 使 用 -g 选 项 ， 然 后 键入 


$ ddd insert sort 


从 而 调用 DDD。 在 GDB 中 ， 通 过 run 命 令 开始 程序 的 执行 ， 如 果 有 命令 行 参数 的 话 ， 束 要 加 上 命 
令 行 参 数 。 在 DDD 中 ， Pd 然后 将 看 到 图 1-8 所 示 的 屏 谷 。 

这 时 弹出 了 Run 窗 口 ， 列 出 了 已 经 使 用 过 的 命令 行 参 数 。 这 里 以 前 还 没有 参数 集 ， 如 果 有 ， 
可 以 通过 单 击 其 中 任何 一 个 来 做 出 选择 ， 也 可 以 按 这 里 所 示 键 入 一 组 新 参数 。 然 后 单 击 Run 投 
£H 。 
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在 GDB 调 试 会 话 中 ， 我 们 在 调试 器 中 运行 了 一 会 儿 程序 ， 然 后 用 Ctrli+C 组 合 键 挂 起 它 ， 以 便 
研究 一 个 明显 的 无 限 循环 。 在 DDD 中 ， 我 们 则 通过 在 命令 工具 中 单 击 Interrupt 来 挂 起 程序 。DDD 
屏幕 现在 如 网 1-9 所 示 。 因 为 DDD 起 GDB 前 端的 作用 , 所 以 这 个 鼠标 单 击 在 GDB 中 被 翻译 为 Ctrl+C 
操作 ， 从 控制 台中 可 以 看 到 这 一 点 。 
上 面 的 GDB 会 话 中 的 下 一 步 是 检查 变量 num_y。 如 前 面 1.5 节 中 所 示 ， 在 DDD 中 ， 通过 在 源 窗 
口中 num_y 的 任意 实例 上 移动 鼠标 来 检查 该 变量 。 


DDD: /ho code/ins.c 





61 
62 int main(int argc, char ** argv) 
63 { get args(argc,argv); 

process data(); 

print, results(); 


'HO — DDD:RunProgram | OX; 





Copyright © 1999-2001 Universität Passau, Germany. 
Copyright © 2001 Universität des Saarlandes, Germany. 
Copyright © 2001-2004 Free Software Foundation, Inc. 
Using host libthread db library "/lib/libthread db.so.1". 
(gdb) 








图 1-8 ”DDD 的 Run 命 令 


19 
20 void scoot over(int jj) 
int k; 


for (k = num y-1; k > jj; k++) 
ylk] = v[k-1]; 





} 
// need to insert just before the first y 
// element that new y is less than 
for (j = 10; 3 < ae j++) { 
if (new y « y[j 


// shift ep yj, .. rightward 
// before inserting n ex y 

scoot over(j); 

y[3] = new y; 

return; 





Program received signal SIGINT, Interrupt. 
insert (new y-2) at ins.c:36 

ntl /home/p/code/ins.c:36:721:beg:0x8048451 
(gdb) 








图 1-9 中 断后 的 屏幕 
也 可 以 用 这 种 方式 检查 整个 数组 。 例 如 ， 在 GDB 会 话 中 的 某 一 个 位 置 ， 输 出 整个 数组 y。 在 
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DDDH!, 只 要 将 鼠标 指针 移 到 源 窗口 中 y 的 任意 实例 上 即 可 。 如 果 在 第 30 行 上 的 表达 式 y[j] 中 的 y 
上 移动 光标 ， 屏 幕 会 如 图 1-10 所 示 。 这 一 行 附近 会 出 现 一 个 值 提示 框 ， 显 示 y 的 内 容 。 

在 GDB 会 话 中 的 下 一 个 动作 是 在 第 30 行 设置 一 个 断 点 。 虽 然 我 们 已 经 解释 了 如 何在 DDD 中 
设置 断 点 ， 但 是 如 果 像 本 例 中 这 样 需要 在 断 点 上 放置 条 件 ， 访 怎么 办 呢 ? 可 以 通过 右 击 断 点 行 中 
的 停止 标记 ， 然 后 选择 Properties 来 完成 这 件 事 。 这 时 会 出 弹出 一 个 窗口 ， 如 图 1-11 所 示 。 然 后 键 


入 条 件 : num y==1。 








if {num y = 0) { // y empty so far, easy case 
yl0] = new y; 
return; 


// need to insert just before the first y 


if (new y « y[31) { 
Jf shift y[j3]; ru rightward 


// before inserting n 
scoot "ih 


void process data() 
{ 


for (num y = 0; num y < num inputs; num_y++) 
// insert new y in the proper place 
// among y[0] y [num y-1] 
; insert (x[num y]); 


54 
55 void print results() 








图 1-10 ROO 


20 void scoot over(int 33) 
Zl 4 dnt k 
22 


for (k = num y-1; k > jj; k++) 
yik] = y[k-1]; 


void insert (int new y) 
C “nt j: 
29 


if (num_y = 0) { // y empty so far, easy case | 
y[0] = new_y; 
return; 


} 

// need to insert just before the first y 
// element that new y is less than 

for (J = Os) j < mm" j++) 


if (new y « y '8o DDD: Properties: Bre int 1 ox 


{ 
// shift ya, yl3*1], 
// before inserting ne 
scoot over(j); 
y[j] = new y; 
return; 


for (num y = 0; num y < num_ 
// insert new y in the pr 
// among y[0] E 


Copyright © 2001-2004 Free Software Foundation, Inc. 
Using host egg db library "/lib/libthread db.so.1". 
(gdb) break ins. 

Breakpoint 1 at 029040484: file ins.c, line 30. 

(gdb) 











图 1-11 在 断 点 上 施加 一 个 条 件 
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然后 ， 为 了 重新 运行 程序 ， 在 命令 工具 中 单 击 Run 按 钮 。 由 于 GDB 的 run 命 令 没 有 参数 ， 
此 这 个 按钮 用 此 前 提供 的 最 后 一 组 参数 运行 程序 。 

在 DDD 中 ， 与 GDB 的 n 和 s 命 令 对 应 的 是 命令 工具 中 的 Next 和 Step 按 钮 。 对 应 于 GDB 中 的 c 命 
令 的 是 Cont 按 钮 。 

本 节 的 概述 足够 用 DDD 开 始 调 试 了 。 在 以 后 的 各 章 中 将 探索 DDD 的 一 些 蜗 级 选项 ， 比 如 非 
第 有 用 的 可 视 化 显示 复 林 数据 结构 (如 链表 和 二 又 树 〉 的 功能 。 


1.7.3 ”Eclipse 中 的 会 话 


现在 让 我 们 看 一 下 上 面 的 GDB 会 话 在 Eclipse 中 是 什么 情况 。 与 在 DDD 中 指出 的 一 样 ， 不 需 
要 重复 所 有 步骤 ， 我 们 百 接 将 重点 放 在 不 同 于 GDB 的 内 容 上 。 

注意 ，Eclipse 会 相当 讲究 。 虽 然 它 提供 了 很 多 方式 完成 菜 种 任务 ， 但 是 如 果 没 有 严格 遵循 必 
需 的 步骤 ， 你 可 能 会 发 现 除 了 重 局 部 分 调试 过 程 忆 外， 根本 没有 百 观 的 解决 方案 。 

这 里 我 们 假设 已 经 创建 了 C/C++ 项 目 。” 

当 第 一 次 运行 或 调试 程序 时 , 需要 运行 和 调试 配置 文件 .这 些 操作 指定 可 执行 文件 的 名 称 ( 以 
及 它 属 于 什么 项 目 )、 其 命令 行 参数 《如 条 有 的 话 )、 其 特殊 shell 变 量 环 境 《〈 如 果 有 的 话 )、 上 所 选 
择 的 调试 器 ， 等 等 。run 配 置 文 件 用 来 在 调试 器 之 外 运行 程序 ， 而 debue 配 置 文 件 用 来 在 调试 内 运 
行程 序 。 一 定 要 按 这 个 顺序 创建 两 个 配置 文件 ， 如 下 所 示 。 

(1) 选择 Run — Open Run Dialog. 

(2) iti C/C Local Applications 并 选择 New。 

(3) 选择 Main 选 项 卡 ， 并 填写 运行 配置 文件 、 项 目 及 可 执行 文件 名 〈Eclipse 可 能 会 提供 一 些 
提示 )， 如 果 有 终端 WO， 选 中 Connect process input and ouput to a terminal 框 。 

(4) 如 果 有 命令 行 参 数 或 特殊 环境 变量 ,， 单 击 Areuments 或 Environment 选 项 卡 ， 并 填写 所 需 设 


BH 





















































B 





(5) i&4#Debuggerit mF LA £x EH A EP as. HPA PRY EAS m eH — Ri, THE 
RZE, ARV ies, SRYTAEGDB. 

(6) 单 击 Apply《〈 如 末 看 到 这 样 的 要 求 ) 和 Close 按 钮 来 完成 运行 配置 文件 的 创建 。 

(7) 通过 选择 Run 一 Open Debug Dialog 来 创建 调试 配置 文件 。Eclipse 可 能 会 重用 你 的 运行 配置 
文件 中 提供 的 信息 ， 如 图 1-12 所 示 ; 如 采 你 愿意 ， 也 可 以 修改 它 。 再 次 单 击 Apply《〈 如 末 要 求 了 ) 
和 Close 按 钮 以 完成 调试 配置 文件 的 创建 。 

可 以 创建 几 个 运行 /调试 配置 文件 ， 通 第 是 用 不 同 的 命令 行 参数 集 。 

为 了 局 动 调试 会 话 ， 必 须 通 过 选择 Window 一 Open Perspective 一 Debug 来 移 到 Debug 透 视图 
中 。〈 有 各 种 各 样 的 快捷 方式 ， 留 待 读者 去 发 现 。) 
当初 次 实际 执行 运行 或 调试 动作 时 ， 同 样 要 通过 Run 一 Open Run Dialog 或 Run 一 Open Debug 

















C 由 于 本 书 关 于 调试 ， 而 不 关于 项 目 管 理 ， 因 此 这 里 不 打算 过 多 地 介绍 如 何在 Eclipse 中 创建 和 构建 项 目 。 然 而 ， 这 
里 可 以 扼要 说 明 一 下 创建 项 目的 步骤 : 选择 File 一 New 一 Project， 选 择 C (或 C++) 项 目 ， 填 写 一 个 项 目 名 ， 选 择 
Executable > Finish. 日 动 创建 一 个 makefile 文 件 。 通 过 选择 Project 一 Build Project 来 构建 项 目 〈 即 编译 与 连接 )。 
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Dialog (根据 情况 而 定 )， 以 指出 使 用 哪个 配置 文件 。 然 而 ， 从 那 以 后 只 要 选择 Run 一 Run 或 Run 
一 Debug， 都 可 以 再 次 运行 上 一 个 调试 配置 文件 。 


ebug 
Create, manage, and run configurations BS 


D @ *| Ge + 








Name: |insert_sort 














in > 9 Arguments | PS Environment | $* Debugger] 5 Source | 上 Common | 





[C/C++ Attach to Local 
v [E)C/C++ Local Applicatic || | Project: 





C/C++ Postmortem de || | C/C++ Application: 
^ uM Search Prject.. 
Z5 Jython unittest 
v Python Run Connect process input output to a terminal. 
Z testpy try.py 
Z5 Python unittest 




















— ái [ Amy j| Ree | 
Filter matched 9 of 9 items 
á (pee) (cese 











1-12 ”Debug 配置 对 话 框 


事实 上 ， 在 本 调试 例子 中 ， 有 一 个 局 动 调试 运行 的 快捷 方式 ， 即 单 击 Navigate 下 的 Debug 和 网 
标 〈 见 图 1-13)。 不 过 要 小 心 ， 每 当局 动 一 个 新 调试 运行 时 ， 都 需要 单 击 一 个 红色 的 Terminate 方 
框 来 退出 正在 运行 的 那个 调试 。 一 个 这 样 的 方 框 在 Debug 视 网 的 工具 栏 中 ， 另 一 个 在 控制 台 视 网 
中 。Debug 视 图 还 有 一 个 双 X 图 标 ，Remove All Terminated Launches. 

















Debug - inse ns.c E atfo 
= Edit ce Navigate Search Projet Run Window Help 
| |B |$ O- Q- |. | Bir Gi- © Or o cm " 


$$ Debug XN 





ee Breakpoints |69- Variables £3 iif Registers. E 




















YV && gdb/mi (12/15/07 3:47 PM) (Suspended) 
"v a? Thread [0] (Suspended) 





o] 
*eé(»:mes:ecss|iexz-7 a- GODEL N 
7 [t]insert sort Deb| Resume! Local Application] | Name Value 


ce sert_sort/ins.c:63 Ox0 
a gdb (12/15/07 3:47 PM) 

















r (i i < num inputs; i++) s v 
xm xd n" yis mwxs 





9 y:i 
int main(int argc, char ** argv) 
* { get_arg — argv); 9 num_inputs : int 
| proc ta(); © vi 
Sagara pi ); num. y : int 
9 get args(int, char**) : void 
9 scoot over(int) : void 














& Console 33 @ Tasks | 区 Problems| G Memory | B x |i ae r4 tB rg su 
insert sort Debug [C/C++ Local Application] /workspace/insert sort/Debug/insert. sort (12/15/07 3:47 PM) 


then: then/endif not found. | 


| De Writable Smart Inset 63:1 | 


























图 1-13 ”调试 运行 的 开始 


图 1-13 显 示 了 局 动 调 试 之 后 出 现 的 屏幕 。 虽 然 人 们 可 以 在 Eclipse 调试 对 话 框 中 设置 局 动 行 ， 
但 是 通常 默认 将 一 i ken F。 在 图 1-13 中 ， 可 以 从 下 面 的 代码 行 的 左 
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XJ "p ESSE AS EA BX wa: 


{ get_args(argc,argv); 








这 一 行 也 是 突出 显示 的 ， 因 为 它 是 要 执行 的 代码 行 。 通 过 在 Debug 视 图 工具 栏 中 单 击 Resume 
图 标 来 前 进 并 执行 , 这 个 工具 栏 在 窗口 中 弹出 的 一 个 框 上面 , 因为 你 将 鼠标 指针 移 到 了 该 图 标 处 。 

在 示例 GDB 会 话 中 ,程序 的 第 一 个 版 本 有 一 个 无 限 循环 , 程序 被 挂 起 。 这 里 当然 会 看 到 同样 
的 现象 ， 控 制 台 视图 中 没有 输出 。 你 需要 关闭 这 个 程序 。 然 而 ， 你 不 想 通 过 单 击 那 个 红色 的 
Terminate 方 框 来 做 到 这 一 点 ， 因 为 这 也 会 天 财 底层 GDB 会 话 。 你 要 留 在 GDB 中 ， 以 便 碍 看 你 位 
于 代码 中 的 何 处 ( 即 无 限 循环 的 位 置 ) 分 析 变 量 的 值 ， 等 等 。 因 此 ， 不 要 选择 Terminate 操 作 ， 而 
要 选择 Suspend， 单 击 Debug 视 图 工具 栏 中 的 Resume 右 边 的 图 标 。( 在 Eclipse 文献 中 ， 这 个 按钮 有 
时 被 称 为 Paquse， 因 为 它 的 符号 类 似 于 媒体 播放 占 中 的 暂 集 操作。) 

当 单 击 Suspend 后 , BEA n E] -14 Tz « 从 图 中 可 以 看 到 在 该 操作 之 采 , Eclipse 打算 执行 以 下 行 。 





























for (j = 0; j < nun y; j++) { 


Eile Edit Refactor Navigate Search Project Run Window Help 
| rà B |" 07 Oy | |27 Gir e er Or seg " 
35 Deb E b. (o Breakpoints (0% Variables 23 ^, it Registers eu 
$ ee ae a = i 
v 回 insert_sort Debug [C/C++ Local Application] 一 | Name Value 
V G& gdb/mi (12/15/07 3:47 PM) (Suspended) 65! new, y 5 
Y a Thread [0] (Suspended: Signal 'SIGINT' received. Descript oj 0 



































need to rt just be fore the first y 
element ‘hat new. le than 
sis G= zu i < mu y; Pm Hi 
(new. 





// shi tt UI. its: — . rightward 

/ serting new_y 
captors 

y[j] = new_y; 





9 scoot over(int) : void 


(© Console 23 £i Tasks | [*: Problems | @ Memory. a ae - re E rie =o) 
insert. sort Debug [C/C++ Local Application] /workspace/insert_sort/Debug/insert_sort (12/15/07 3:47 PM) | 
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en MAS 
现 该 值 为 0)， 等 等 。 

再 次 回顾 我 们 前 面 的 GDB 会 话 。 当 修复 了 几 个 程序 错误 后 ， 程 序 出 现 了 一 个 段 错误 。 网 1-15 
显示 了 那 一 刻 的 Eclipse 屏幕 。 

发 生 的 事情 是 当时 我 们 单 击 了 Resume 按 钮 ， 因 此 程序 继续 运行 ， 突 然 因 为 段 错 误 而 在 如 下 
这 行 代码 处 停止 


ylk] = y[k-1]; 
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奇怪 的 是 ， 从 图 1-15 中 还 可 以 看 出 ，Eclipse 没 有 在 Problems 选 项 卡 中 指出 这 个 问题 ,而 是 在 Debug 
选项 卡 中 显示 如 下 错误 消 忆 。 


(Suspended'SIGSEGV' received. Description: Segmentation fault.) 













Debu nse [LET - 
Eile "m rum em T€ Project Run Window Help 


@ | #- O- Q7 | 7 | 8 Ge € Oe Oe t: Debug) 











i2 Debug $t : | “ol Breakpoints | Variables % Bit Registers) 
€» i> a A @ .& i P» B 

= [€ ]insert. sort Debug [C/C++ Local Application] 加 || Name Value 

| "Y Ge gdb/mi (12/15/07 4:40 PM) (Suspended) o5 0 










"v of Thread [0] (Suspended: Signal 'SIGSEGV' received. Des 

















= num y; k > jj; k++) 
i hy y[k-1]; 


void insert(int new y) 
( int j; 





9 get args(int, char") : void 
9 scoot over(int) : void 









if (m raga ie ( // y empty so far, easy case 










insert. sort. v ICE Local Application] /workspace/insert_sort/Debug/insert_sort (12/15/07 4:40 PM) 
fthen: then/endif not found. 














Kli-15 BIRR 
在 这 个 选项 卡 中 可 以 看 到 错误 发 生 在 从 insert() 中 调用 的 函数 scoot_over() 中 。 像 在 GDB 








示例 中 那样 ， 你 同样 可 以 查询 变量 的 值 ， 比 如 发 现 K=544 超 出 了 范围 。 

在 GDB 示 例 中 还 设置 了 条 件 断 点 。 在 Eclipse 中 通过 在 所 和 需 行 的 左边 空中 双击 来 设置 断 点 。 
使 该 断 点 为 条 件 断 点 ， 那 么 右 击 那 一 行 的 断 点 符号 ， 并 选择 Breakpoint Properties... — New —> 
Common， 然 后 在 对 话 框 中 填写 条 件 。 该 对 话 框 如 图 1-16 所 示 。 


v | Properties for C/C-— breakpoint 


Common 








Actions Type: C/C++ line breakpoint 


Hi. jwoapucuer son 


Filtering Line number. 30 
Enabled 


Condition:  |umy--d | 
aa 








图 1-16 ”使 断 点 成 为 条 件 断 点 
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我 们 还 介绍 过 ， 在 GDB 会 话 中 ， 偶 尔 会 在 GDB 外 面 〈 在 单独 的 终端 窗口 中 ) 执行 程序 。 在 
Eclipse 中 通过 选择 Run 一 Run 也 可 以 轻松 地 做 到 这 一 点 。 与 惯 第 一 样 ， 结 果 将 显示 在 控制 台 视 图 
uu 


1.8 ”启动 文件 的 使 用 


正如 前 面 捉 到 的 ， 在 重新 纺 详 代码 时 ， 最 好 不 要 退出 GDB。 这 样 ， 你 的 断 点 和 建立 的 其 他 各 
种 动作 都 会 你 留 《〈 比 如 第 3 章 将 介绍 的 display 命 令 )。 要 是 退出 GDB， 台 不 得 不 再 次 重复 键入 所 
有 这 些 内 容 。 

然而 ， 在 完成 调试 前 可 能 需要 退出 GDB。 如 果 你 要 离开 一 段 时 间 基 至 离开 一 天 ,而且 不 能 你 
持 登 录 在 计算 机 中 ， 则 需要 退出 GDB。 为 了 不 丢失 它们 ， 可 以 将 断 点 和 设置 的 其 他 命令 放 在 一 个 
GDB 月 动 文件 中 ， 然 后 每 次 月 动 GDB 时 会 目 动 加 载 它 们 。 

GDB 的 司 动 文件 默认 名 为 .8dpzziz。 可 以 将 一 个 文件 放 在 主 目录 中 用 于 一 般 用 途 ， 万 一 个 文 
件 放 在 特定 项 目 专 用 的 目录 中 。 例 如 ,将 设置 断 点 的 命令 放 在 后 一 个 目录 的 局 动 文件 中 。 在 主 目 
录 的 .gdpimitf 文 件 中 ， 还 可 以 存储 你 开发 的 一 些 通用 的 宏 《〈 第 2 章 将 会 介绍 )。 

GDB 在 加 载 可 执行 文件 乙 前 会 谈 取 主 目录 中 的 局 动 文件 。 因 此 ， 要 是 在 主 目录 的 .gd2ozzz 文 
PAS, ECM: 


break g 




































































表示 要 在 函数 g() 上 中 断 ， 那 么 GDB 总 是 会 在 启动 时 抱怨 它 不 知道 该 函数 。 然 而 ， 在 本 地 项 目 目 
录 的 局 动 文件 中 可 以 有 这 行 代 码 ， 因 为 本 地 局 动 文件 是 在 加 载 了 可 执行 文件 〈 及 其 符号 表 ) 之 后 
读 取 的 。 注意 ，GDB 的 这 个 特性 暗示 了 最 好 不 要 将 编程 项 目 放 在 主 目录 中 ， 因 为 不 能 将 项 目 特有 
的 信息 放 在 .gdbinit 中 。 

在 调用 GDB 时 可 以 指定 启动 文件 。 例 如 ， 


$ gdb -command=z x 

















表示 要 在 可 执行 文件 x 上 运行 GPDB， 肯 和 完 要 从 文件 z 中 读 取 命令 。 此 外 ， 因 为 DDD 只 是 GDB 的 一 
个 前 端 ， 所 以 调用 DDD 也 会 调用 GDB 的 局 动 文件 。 
最 后 ， 可 以 通过 选择 Edit 一 Preferences 来 以 各 种 各 样 的 方式 定制 DDD。 对 于 Eclipse， 选 择 


Windows- Preferences. 
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NOR 然而 ， 在 可 执行 文件 中 神奇 般 
地 加 入 调试 符号 后 ， 调 试问 呈现 了 可 以 逐 行 执行 源 代 码 的 错 党 ， 而 不 是 基于 逐个 被 编 
详 的 机 器 人 码 指令 执行 。 这 一 看 似 镜 单 的 事实 恰好 使 得 符 写 调试 如 在 调试 程序 中 非常 有 用 。 

如 果 调 试 器 能 做 的 仅仅 是 运行 程序 ， 那 么 对 我 们 来 说 没有 太 大 的 用 处 。 我 们 当然 也 能 做 同样 
的 事情 ， 而 且 还 更 有 效率 。 调 试 器 的 好 处 在 于 : 可 以 通知 它 暂 俘 程 序 的 执行 。 和 暂停 以 后 ， 调 试 需 
让 我 们 得 以 检 碍 变量 、 跟 踩 执 行路 径 等 。 


2.1 暂停 机 制 


有 3 种 方式 可 以 通知 GDB 和 暂停 程序 的 执行 。 

O 断 点 : 通知 GDB 在 程序 中 的 特定 位 置 暂停 执行 。 

O 监视 点 : 通知 GDB 当 特定 内 存 位置 ( 或 者 涉及 一 个 或 多 个 位 置 的 表达 式 〉 的 值 故 生变 化 
时 暂停 执行 。 

O 捕获 点 : 通知 GDB 当 特定 事件 发 生 时 暂停 执行 。 

容易 混 消 的 是 〈 一 开始 )， 在 GDB 文 档 中 将 这 3 个 机 制 都 称 为 断 点 。 这 可 能 是 因为 它们 的 很 多 

属性 和 命令 都 相同 。 例 如 ， 在 帮助 文档 中 可 以 看 到 ，GDB 关 于 删除 断 点 的 delete 命 令 : 
(gdb) help delete 
Delete some breakpoints or auto-display expressions. 


Arguments are breakpoint numbers with spaces in between. 
To delete all breakpoints, give no argument. 


ANI, AAI GDB I A IEA BJ] SCS FE FAN FC AE x 1 e delete sir n] EIER Pr 9r es 
He AULA ARR ! 
2.2 lar ea tetas 

Writ BEEP HP ZED: 在 程序 中 的 特定 “人 位置” 设置 断 点 ， 当 到 达 那 一 点 时 ， 调 试 器 会 暂 
停 程序 的 执行 《在 GDB 这 样 的 基于 文本 的 调试 器 的 情况 下 ， 会 出 现 命 令 行 提示 符 )。 

GDB 中 关于 “位 置 ”的 含义 是 非常 灵活 的 ， 它 可 以 指 各 种 源 代码 行 、 代 人 码 地 址 、 源 代码 文件 
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中 的 行 写 或 者 函数 的 入 口 等 。 
下 和 面 是 一 个 调试 会 话 片 段 ， 说 明 当 GDB 在 一 行 代码 上 中 断 时 发 生 的 事情 。 在 这 段 代 人 码 中 ， 列 
出 了 部 分 源 代码 ， 在 程序 的 第 35 行 放置 了 一 个 断 点 ， 然 后 运行 程序 。GDB 到 达 该 断 点 并 暂停。 

















(gdb) list 

30 

31 /* Get the size of file in bytes */ 

32 if ((fd = open(c.filename, O RDONLY)) == -1) 
33 (void) die(1, "Can't open file."); 
34 (void) stat(c.filename, &fstat); 

35 c.filesize = fstat.st size; 

36 


(gdb) break 35 

Breakpoint 1 at 0x8048ff3: file bed.c, line 35. 

(gdb) run 

Starting program: binary editor/bed 

Breakpoint 1, main (argc-1, argv=Oxbfa3e1f4) at bed.c:35 

35 c.filesize - fstat.st size; 

(gdb) 

让 我 们 解释 一 下 这 里 发 生 了 什么 事 : GDB 从 第 30 行 执行 到 第 34 行 ， 但 是 第 35 行 还 没有 执行 。 
这 可 能 有 点 让 人 迷惑 ， 因 为 很 多 人 以 为 GDB 显 示 的 是 最 后 执行 的 代码 行 ， 而 事实 上 , 它 显 示 的 是 
将 要 执行 的 代码 行 。 在 本 例 中 ，GDB 告 诉 我 们 第 35 行 是 将 要 执行 的 下 一 行 源 代 码 。 当 GDB 的 执 
行 到 达 第 3$ 行 的 断 点 时 ， 可 以 认为 GDB 在 源 代 码 的 第 34 行 和 第 35$ 行 之 间 等 待 。 

然而 你 知道 GDB 的 工作 针对 的 是 机 絮语 言 指令 ， 而 不 是 源 代 码 行 ， 一行 代码 可 能 对 应 于 数 
行 机 噩 语言 。GDB 之 所 以 可 以 使 用 源 代 码 行 ， 是 因为 可 执行 文件 中 包括 了 额外 的 信息 。 昌 然 这 个 
事实 暂时 似乎 还 不 太 重 要 ， 但 是 在 本 章 讨论 单 步 调试 程序 时 会 有 一 定 的 涉及 。 


2.3 ”跟踪 断 点 

程序 员 创建 的 每 个 断 点 (包括 断 点 、 监 视点 和 捕获 点 〉 都 被 标识 为 从 1 开始 的 唯一 整数 标识 
符 。 这 个 标识 符 用 来 执行 该 断 点 上 的 各 种 操作 。 调 试 右 还 包括 一 种 列 出 所 有 上 断 点 及 其 属性 的 方式 。 
2.3.1 GDB 中 的 断 点 列表 

当 创 建 断 点 时 ，GBD 会 告知 你 分 配给 该 断 点 的 编写。 例如， 本 例 中 设置 的 断 点 : 

(gdb) break main 

Breakpoint 2 at 0x8048824: file efh.c, line 16. 
BLOT ACH S E20 WARS 2T Ace HAS HUSR eT A, a MEH info breakpoints 命 令 
来 所 示 。 

(gdb) info breakpoints 

Num Type Disp Enb Address What 
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1 breakpoint keep y  0x08048846 in Initialize Game at efh.c:26 
2 breakpoint keep y | 0x08048824 in main at efh.c:16 

breakpoint already hit 1 time 
3 hw watchpoint keep y efh.level 


4 catch fork keep y 


我 们 将 看 到 这 些 标 识 符 用 来 执行 断 点 上 的 各 种 各 样 的 操作 。 为 了 具体 说 明 ， 来 看 一 个 简单 的 pm 





示例 。 
上 一 节 中 介绍 了 delete 人 命令。 通过 使 用 delete 命 令 以 及 断 点 标识 符 ， 可 以 删除 断 点 1、 监 视 
点 3 及 捕获 点 4 


(gdb) delete 13 4 


下 面 儿 市 将 介绍 断 点 标识 符 的 其 他 用 途 。 
2.3.2 ”DDD 中 的 断 点 列表 


DDD 用 户主 要 使 用 点 选 式 界面 执行 断 点 管理 操作 ， 因 此 断 点 标识 符 对 于 DDD 用 刀 不 如 对 
GDB 用 户 那 么 重要 。 选 择 Source 一 Breakpoints 会 弹出 Breakpoints and Watchpoints 窗 口 ， 其 中 列 出 
了 所 有 上 断 点 ， 如 图 2-1 上 所 示 。 


y[k] = y[k-1]; 





void insert(int new yJ[ 
P dnt 15 


if (num y = 0) £ // y empty so far, easy case 
y[0] = new y; 
return; 


// need to insert aer maie Rod first y 
// element tha En ew y is les 
num y; kiji 


415 yen. = z Pionward 
before dnsarting 
scoot_over(j); 
= des 
return; 


v opp: Breakpoints and Watchpoints 


Diss Enb aed 


2 breakpoint pep y 4 ] 3t ns.ci4 
3 breakpoint Tm y TIRET in process. data at ins.c:52 
a Nibreakpoint already hit 1 time 


(gdb) run 12 
then: then/e 


Breakpoint 3 
(gdb) I 





图 2-1 在 DDD 中 查看 断 点 
然而 表面 介绍 过 ，DDD 人 允许 使 用 GBD 的 基于 命令 的 界面 及 其 提供 的 GUI。 在 有 些 情 部下 ， 
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GDB 提 供 了 不 能 通过 DDD GUI 使 用 的 断 点 操作 ， 但 是 DDD 用 户 能 够 通过 DDD 控 制 台 访问 那些 特 
殊 的 GDB 操 作 。 在 这 些 情况 下 ， 汤 点 标识 答对 DDD 用 户 仍 然 是 很 有 用 的 。 

注意 ， 如 果 愿 意 ， 可 以 让 这 个 Breakpoints and Watchpoints 窗 口 始 终 打 开 ， 只 要 将 它 拖 放 到 屏 
攻 的 方便 部 分 即 可 。 
2.3.8 ”Eclipse 中 的 断 点 列表 


Debug 透 视图 中 包括 Breakpoints 视 图 。 例 如 ， 在 图 2-2 中 可 以 看 到 文件 ins.c 的 第 30 行 和 第 52 行 
目前 有 两 个 断后 。 

















D | %- DO- Q |e | Sir Gr 





= B 9o Breakpoints 23 \ Variables | >o 
eZl gY X d$ 60 OB’ 
e /workspace/insert_sort/ins.c [line: 30] 


























(EE Outline N E 





for (num y = 0; num y « num inputs; num_y++) A €. x € * 


// insert new y in the proper place 9 x: int] 


€ y:ing 
€ num inputs : int 





void print results() € num y : int 
[ int i; 9 get args(int, char"*) : void 


nr (i = 0 i < mm innuts* i 9 scoot over(int) : void 





(E Console 1^ IZ Tasks | i Problems | ^E-rj-B 
No consoles to display at this time. 


^ lema 


























" Writable Smart Insert 30:51 | 


图 2-2 ”在 Eclipse 中 查看 断 点 
可 以 右 击 任 意 断 点 的 入 口 来 检查 或 修改 其 属性 。 另 外 ,双击 入 口 将 导致 源 文件 窗口 的 焦点 转 
Te SIUS Ex E. 
2.4 iE S 
VV LHOB Se Y ARP ELIT ESL 
2.4.1 在 GDB 中 设置 断 点 


表面 已 经 介绍 过 ，GDB 给 人 一 种 逐 行 运行 源 代 码 的 销 觉 。 使 用 GDB 时 ， 需 要 指示 在 何 处 暂 
停 执 行 ， 以 便 使 用 GDB 的 命令 行 提 示 符 执行 调试 活动 。 本 节 将 介绍 如 何 设 置 断 点 ， 并 通知 GDB 
在 源 代 码 的 何 处 停止。 

GDB 中 有 许多 指定 断 点 的 方式 ， 下 面 是 一 些 最 常见 的 方法 。 
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€ break function 
FE ek X fFunction() A H1 ETATE) 处 设置 断 点 。 在 2.3.1 季 中 提供 过 这 种 示例 ， 
下 述 命 令 在 main() 的 入 口 处 设置 断后 : 


(gdb) break main 


€ break Line number 
在 当前 活动 源 代 码 文 件 的 Line_number 处 设置 断 点 。 对 于 多 个 文件 的 程序 ， 这 要 么 是 上 次 使 
用 1ist 命 令 查看 其 内 容 的 文件 ， 要 么 是 包含 main() 的 文件 。2.2 节 中 提供 过 这 种 情况 的 示例 。 








(gdb) break 35 


它 在 文件 pedc 中 的 第 3$ 行 处 设置 了 一 个 断 点 。 

€ break filename:Line number 

TE JS XB X fF fFilenamel] Line number Ab ix EE ES. UlWfilename^1E2 gj LfEHoen, M 
可 以 给 出 相对 路 径 名 或 者 完全 路 径 名 来 帮助 GDB 查 找 该 文件 ， 例 如 : 











(gdb) break source/bed.c:35 


€ break filename:function 
在 文件 fiLename 中 的 函数 function() 的 入 口 处 设置 断 点 。 香 和 载 函 数 或 者 使 用 同名 前 态 函 数 的 
程序 可 能 需要 使 用 这 种 形式 ， 例 如 : 


(gdb) break bed.c:parseArguments 





我 们 后 面 将 看 到 ， 当 设置 一 个 断 点 时 ， 该 断 点 的 有 效 性 会 持续 到 删除 、 茶 用 或 退出 GDB 时 。 
然而 ,临时 断 点 是 首次 到 达 后 吏 会 被 目 动 删除 的 断 点 。 临 时 断 点 使 用 tbreak 命 令 设 置 , 它 与 break 
采用 相同 类 型 的 参数 。 例 如 ，tbreak foo.c:16 在 文件 po.c 的 第 10 行 处 设置 临时 断 点 。 








其 他 break 人 参数 
break 命 令 还 有 一 些 别 的 参数 ， 也 许 很 少 用 到 。 
口 使 用 break +offset 或 break -ofFFset， 可 以 在 当前 选中 栈 帧 中 正在 执行 的 源 代 码 行 之 前 
或 之 后 offset 行 设置 断 点 。 
口 break *address 这 种 形式 可 用 来 在 虚拟 内 存 地 址 处 设置 断 点 。 这 对 于 程序 没有 调试 信息 
的 部 分 ( 比如 找 不 到 源 代码 时 ， 或 者 对 于 共享 库 ) 是 必需 的 。 


对 于 同名 函数 要 加 上 注释 。C++ 人 允许 重 载 函 数 ( 使 用 相同 的 名 称 定义 函数 )。 甚 至 在 C 语 言 中 
也 可 以 重 载 函 数 ， 只 要 使 用 static 限 定 符 声 明 带 文件 作用 域 的 函数 。 使 用 break function 会 在 所 
有 具有 相同 名 称 的 函数 上 设置 断 点 。 如 果 要 在 函数 的 某 个 特定 实例 上 设置 断 点 , 则 需要 没有 歧义 ， 
比如 在 break 命 令 中 给 出 源 代码 文件 中 的 行 号 。 

GDB 实 际 设置 断 点 的 位 置 可 能 与 你 请 求 将 断 点 放置 的 位 置 不 同 。 不 熟悉 GDB 的 开发 人 员 
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可 能 对 此 感到 不 安 ， 因 此 让 我 们 看 一 下 这 种 奇怪 现象 的 简短 示例 。 来 看 下 面 这 个 短程 序 ， 
testi.c: 


1 int main(void) 
» { 

3 int i; 

4 1 = 31 


6 return 0; 
7 } 


不 加 优化 地 编译 这 个 程序 ， 并 党 试 在 main() 的 入 口 处 设置 断 点 。 你 以 为 断 点 会 放 在 函数 的 上 
方 一 一 在 第 1 行 、 第 2 行 或 第 3 行 。 虽 然 人 们 第 向 猜测 断 点 会 在 这 些 位 置 ， 但 是 他 们 错 了 。 上 断 点 实 
际 上 在 第 4 行 。 














$ gcc -g3 -Wall -Wextra -o test1 testi.c 

$ gdb test1 

(gdb) break main 

Breakpoint 1 at Ox6: file testi.c, line 4. 


第 4 行 不 能 算是 main() 的 开头 行 ， WARE T TTARUE? 你 可 能 猜 到 ， 一 个 原因 是 这 一 行 是 
可 执行 代码 。 我 们 介绍 过 ，GDB 实 际 上 是 使 用 机 器 语言 指令 工作 的 ， 但 是 有 了 增强 的 符号 表 的 
厢 力 后 ，GDB 表 现 出 了 使 用 源 代 码 行 的 错觉 。 一 般 来 说 这 个 事实 不 太 重 要 ， 但 是 在 这 种 情况 下 
这 一 事实 却 变 得 很 重要 。 实 际 上 ， 声 明 i 确 实 会 生成 机 豆 码 ， 但 是 GDB 认 为 这 种 机 融 人 码 对 于 我 们 
的 调试 目的 来 说 没有 用 处 。" 因 此 ， 妆 要 求 GDB 在 main() 的 开头 中 断 时 ， 它 就 在 第 4 行 设置 了 一 


INO 

















其 他 断 点 类 型 

此 外 ， 还 有 一 些 break 风 格 的 命令 ， 本 书 不 打算 深入 介绍 ， 因 为 它们 的 专用 性 很 强 。 

hbreak 命 令 设 置 硬 件 辅助 断 点 。 这 是 可 以 在 内 存 中 设置 的 断 点 ， 不 需要 修改 该 内 存 位 置 的 
内 容 。 这 需要 硬件 支持 ， 主 要 用 于 EEPROM/ROM 调试 。 此 外 ， 还 有 一 个 设置 临时 硬件 辅助 断 
点 的 thbreak 命 令 。hbreak 和 thbreak 命 令 采 用 与 break 和 tbreak 相 同类 型 的 参数 ， 

rbreak 命 令 采 用 grep 风 格 的 正则 表达 式 ， 并 在 匹配 该 正则 表达 式 的 任何 函数 的 入 口 处 设置 
断 点 。 关 于 rbreak 要 知道 两 件 事 。 HA, 请 记 住 rbreak 使 用 grep 风 格 的 正则 表达 式 , 而 不 是 Perl 
风格 的 正则 表达 式 或 者 shell 风 格 的 文件 名 蔡 换 ( globbing )。 举 例 来 说 ， 这 意味 着 rbreak func* 
会 将 断 点 放 在 名 为 func 和 funcc() 的 函数 上 ， 而 不 会 放 在 function() 上 。 其 次 ， 在 rbreak 的 参 
数 前 面 或 后 面 有 一 个 隐 仿 的 .*， 因 此 ， 如 果 不 布 望 rbreak func 在 afunc() 上 设置 断 点 ， 应 当 使 
用 rbreak ^func. 


(D 可 以 通过 -Ss 选 项 查看 GCC 生成 的 机 器 码 。 
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当 打 开 优 化 来 编译 程序 时 ， 这 个 问题 可 能 变 得 更 糟 料 。 让 我 们 来 看 一 下 。 打 开 优 化 ， 重 新 编 
译 该 程序 。 

$ gcc -09 -g3 -Wall -Wextra -o test1 test1.c 

$ gdb test1 


(gdb) break main 
Breakpoint 1 at 0x3: file test1.c, line 6. 


我 们 要 求 在 main() 的 开头 放置 一 个 断 点 ， 但 是 GDB 在 main() 的 最 后 一 行 放置 了 一 个 断 点 。 
到 底 发 生 了 什么 事 ? 答案 与 前 面相 同 ， 只 是 GCC 扮演 了 一 个 更 主动 的 和 角色。 在 优化 打开 的 情况 
下 ，GCC 注 意 到 虽然 为 i 赋 了 予 了 一 个 值 ， 但 是 永远 用 不 到 这 个 值 。 因 此 ， 为 努力 生成 更 有 效 的 代 
人 码 ，GCC 就 把 第 3 行 和 第 4 行 代码 优化 掉 了 。GCC 永 远 不 会 生成 这 几 行 的 机 器 指令 。 因 此 ， 生 成 
机 器 指令 的 第 一 行 源 代 人 码 恰 好 是 main() 的 最 后 一 行 。 这 是 在 调试 完成 前 不 应 当 优 化 代码 的 原因 
cues 

















捕 3x 点 
C++ 程 序 员 或 许 会 想 了 解 设置 捕获 点 的 catch 命 令 。 捕 获 点 类 似 于 断 点 ， 但 是 能 够 通过 如 
抛 出 异常 、 捕 获 异 常 、 发 信号 通知 、 调 用 fork()、 加 载 和 得 载 库 等 很 多 事件 触发 。 
本 书 将 详细 介绍 断 点 和 监视 点 ， 而 让 读者 参阅 GDB 文 档 了 解 关 于 捕获 点 的 更 多 信息 。 








知道 所 有 这 坚 情 况 后 ， 如 宋 发 现 设置 断 点 后 没有 正好 在 你 预期 的 地 方 产 生 断 点 ， 你 现在 丈 知 
BENAT, AAA) PE. 

2 AREE 8. TR) TURNS EAS TN aS RET ATL. SIGDBIEH Z IST 
所 中断 一 行 源 代 码 时 ， 它 只 会 中 断 一 次 。 换 言 之 ， 当 它 到 达 该 行 代码 时 ， 如 于 恢复 执行 ， 会 忽略 
恰好 在 同一 行 上 的 其 他 断 点 。 事 实 上 ，GDB 知 道 是 哪个 断 点 “触发 ”了 程序 停止 执行 。 在 具有 多 
个 断 点 的 代码 行 上 ， 触 发 中 断 的 断 点 将 是 标识 符 编 号 最 小 的 断 点 。 


2.4.2 在 DDD 中 设置 断 点 


为 了 使 用 DDD 设 置 断 点 , 在 源 窗 口中 得 找 要 议 置 断 点 的 代码 行 。 将 光标 放 在 那 一 行 上 的 任意 
宇 折 处， 碳 击 ， 这 时 会 弹出 一 个 染 单 。 将 鼠标 同 下 拖 动 ， 直 到 突出 显示 Set Breakpoint 选 项 ， 然 后 
释放 鼠标 按键 。 这 时 应 当 在 议 置 断 点 的 代码 行 劳 边 看 到 一 个 红色 俘 止 记号 。 如 果 没 有 使 用 断 点 做 
任何 特别 的 事 ， 比 如 使 它 成 为 条 件 断 点 〈 将 在 2.10 节 讨论 )， 那 么 一 种 快捷 方式 是 直接 双击 这 行 
代码 。 

如 条 一 二 在 用 DDD， 你 可 能 会 注意 到 ， 当 在 一 行 代码 劳 边 按 下 鼠标 右键 时 ， 弹 出 沫 单 中 会 包 
含 选项 Set Temporary Breakpoint。 这 束 是 在 DDD 中 设置 临时 断 点 〈 当 首次 到 达 后 束 消 失 的 断 点 ) 



























































O 实际 上 , 在 打开 优化 编译 可 执行 文件 时 ， 有 些 调试 器 真 的 会 阻塞 。GDB 是 可 以 调试 优化 代码 的 为 数 不 多 的 调试 器 
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的 方法 ， 这 种 方法 调用 了 GDB 的 tbreak 命 令 。 

同样 ， 不 要 未 记 DDD 实 际 上 是 GDB 的 前 端 。 可 以 在 DDD 中 使 用 DDD 的 控制 台 窗 口 执行 任意 
GDB 风 格 的 中 断 命令 。 有 时 需要 这 种 办 法 ， 如 果 程 序 非 常 大 或 者 是 多 文件 程序 ， 那 么 使 用 GDB 
语法 设置 断 点 会 很 方便 。 事 实 上 ， 之 所 以 有 时 有 必要 这 样 做， 是 因为 并 非 GDB 的 所 有 上 断 点 命令 都 
可 以 从 DDD 界 面 中 调用 。 


2.4.3 在 Eclipse 中 设置 断 点 


为 了 在 Eclipse 中 对 给 定 代 码 行 设 置 断 点 ,双击 该 行 代 码 。 这 时 会 出 现 一 个 断 点 符号 ， 如 图 2-2 
中 的 如 下 代码 行 所 示 。 


insert(x[num y]); 


EA GENES. FATT TS, PS TES EE DUO di, JRun to Line。 然 而 要 
* 只 有 当 目 标 行 与 当 前 位 置 位 于 同一 个 函数 中 时 ， Run to Line 操 作 才 会 起 作用 ， 而 且 要 在 重 
到 这 一 行 前 没有 退出 该 函数 才 行 。 


2.5 展开 GDB 示例 


因为 有 很 多 信息 ， 所 以 有 必要 举 一 个 可 以 照 着 做 的 设置 断 点 的 简短 例子 。 来 看 下 面 的 多 文件 
CRAIE o 















































main.c: swapper.c: 
#include <stdio.h> void swap(int *a, int *b) 
mals taut ohh. f 
void swap(int *d, int *DJ; 1 
int c = xa; 

int main(void) #a = bs 
{ *b = c; 

int i = 3; } 

int j = 5; 


printf("i: %d, j: %d\n", i, j}; 
swap(&i, 8j); 
printf("i: Xd, j: %d\n", i, j); 


return 0; 


} 
编译 该 代 公 并 在 可 执行 文件 上 运行 GDB。 
$ gcc -g3 -Wall -Wextra -c main.c swapper.c 


$ gcc -o swap main.o swapper.o 
$ gdb swap 
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说 明 本 倒是 本 书 中 首次 编译 — 因此 这 里 作 一 下 说 明 。 上 述 编译 过 程 的 第 一 行 产 生 了 两 
个 目标 文件 ， 其 中 包含 带 调试 信息 的 未 决 目 标 代码 。 第 二 行将 目标 文件 连接 到 一 个 包含 所 有 
ee LS MEE. 








局 动 调试 会 话 时 在 main() 中 设置 断 点 是 很 常见 的 。 这 一 操作 在 该 函数 的 第 一 行 上 设置 断 点 。” 


(gdb) break main 
Breakpoint 1 at 0x80483f6: file main.c, line 6. 


Fin) PTB as Bl ABE PS ZI swap () IN —11 EWE SW. 里 然 看 上 去 可 能 不 同 , 但 是 它们 做 
的 都 是 同一 件 事 : 在 swap() 的 上 方 中 断 。 
(gdb) break swapper.c:1 


Breakpoint 2 at 0x8048454: file swapper.c, line 1. 
(gdb) break swapper.c: swap 














Rroabnnint 2 at nv9nASAERa- filo cwanne 
DECAKPOLTL 5 di VASU4ZO4IdG. TliC Swapper. 


(gdb) break swap 
Note: breakpoint 3 also set at pc 0x804845a. 
Breakpoint 4 at 0x804845a: file swapper.c, line 3. 


TEAL ZG EIN TH], GBA “MER, ADORE AVES HT “Won” Xp. AARE RAE MT 
命令 做 了 限定 ， 人 否则 都 是 在 具有 GDB 的 焦点 的 文件 上 执行 命令 。 默 认 情 况 下 ， 具 有 GDB 的 初始 
焦点 的 文件 是 包含 main() 国 数 的 文件 ， 但 是 当 发 生 如 下 任 一 动作 时 ， 焦 点 会 转移 到 不 同 的 文件 
B 

a 问 不 同 的 源 文件 应 用 1ist 命 令 。 

Q 进入 位 于 不 同 的 源 代码 文件 中 的 代码 。 

a 当 在 不 同 的 源 代 码 文件 中 执行 代码 时 GDB 过 到 断 点 。 

让 我 们 看 一 个 示例 。 虽 然 断 点 是 在 swapperc 中 设置 的 ， 但 是 我 们 实际 上 没有 列 出 该 文件 中 的 
代码 。 因 此 ， 焦 点 仍然 位 于 main.c 上 。 可 以 通过 在 第 6 行 上 设置 断 点 来 验证 这 一 点 。 当 不 市 文件 
名 地 设置 这 个 断 点 时 ，GDB 会 在 当前 活动 文件 的 第 6 行 上 设置 断 点 。 


(gdb) break 6 
Breakpoint 5 at Ox8048404: file main.c, line 6. 






































可 以 表 定 的 是 ，main.c 具 有 焦点 ， 当 启 动 GDB 时 ， 仪 仅 通过 行 号 设置 的 断 点 是 在 包含 main() 
的 文件 中 设置 的 。 可 以 通过 列 出 swapperc 中 的 代码 来 改变 焦点 。 


(gdb) list swap 
1 void swap(int xa, int xb) 





CD 断 点 可 能 不 是 恰好 在 main() 的 第 一 行 上 , 但 是 会 在 靠近 第 一 行 的 位 置 。 然 而 , 与 我 们 前 面 介 绍 这 一 点 的 示例 不 同 ， 
这 里 的 代码 行 是 可 执行 的 ， 因 为 它 为 i 赋 了 值 。 
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2. 3 

3 int c = sq. 

4 ka = xb; 

5 *b = c; 

6 } 

可 以 试看 在 第 6 行 上 设置 男 一 个 断 点 ， 来 确认 swapperc 现 在 具有 焦点 。 


(gdb) break 6 
Breakpoint 6 at 0x8048474: file swapper.c, line 6. 











可 以 看 出 ， 断 点 确实 是 在 swapperc 的 第 6 行 上 设置 的 。 然 后 将 在 swapperc 的 第 4 行 上 设置 一 个 
临时 断 点 : 


(gdb) tbreak swapper.c:4 
Breakpoint 7 at Ox8048462: file swapper.c, line 4. 


最 后 ， 使 用 2.3.1 节 介绍 的 ijnfo breakpoints 命 令 ， 来 展示 一 下 刚才 设置 的 所 有 上 断 点 的 阵容 。 


(gdb) info breakpoints 

Num Type Disp Enb Address What 

breakpoint keep 0x080483f6 in main at main.c:6 
breakpoint keep 0x08048454 in swap at swapper.c: 





Pon n0 AC” at JOammer £D 


lv aln vit Laan 1 ru Eira Ci * 
VAVOUGO4 Od Lii 5wap dt »wapptr.c. 


y 

y 

DICaKpoint KEEP y 

breakpoint keep y 0x0804845a in swap at swapper.c: 
breakpoint keep y 0x08048404 in main at main.c:9 
breakpoint keep y — 0x08048474 in swap at swapper.c:6 
breakpoint del y  0x08048462 in swap at swapper.c:4 


到 后 面 结束 GDB 会 话 时 ， 再 使 用 quit 命 令 离开 GDB。 


(gdb) quit 
$ 


2.6 ”断后 的 持久 性 


我 们 上 和 面 说 的 “后 面 ”是 指 在 调试 会 话 期 间 不 应 退出 GDB。 例如 ， 当 发 现 并 修复 了 一 个 程序 
首 误 ,但 是 其 他 程序 错误 仍然 存在 时 ,不 应 当 退 出 GDB 然 后 重新 进入 来 使 用 程序 的 新 版 本 。 这 样 
HBA LEDS hy Bast AEB, TM ARS NAGASE A To 

如 末 在 修改 和 重新 编 详 代码 时 没有 退出 GDB， 那 么 在 下 次 执行 GDB 的 run 命 令 时 ，GDB 会 感 
AES OEM, FFA SINHA 

然而 要 注意 ， 断 点 是 会 “移动 ”的 。 例 如 ， 来 看 下 面 这 个 简单 程序 。 


1 main() 
o { int x,y; 


-| Ow 4 Ww M m 
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3 = 1; 
4 = 2; 
j 
编译 该 程序 ， 进 入 GDB， 并 在 第 4 行 设置 一 个 断 点 。 
(gdb) 1 
1 main() 
2 { int x,y; 
3 x= 1; 
4 y = 2; 
5 } 
(gdb) b 4 
Breakpoint 1 at Ox804830b: file a.c, line 4. 
(gdb) r 


Starting program: /usr/home/matloff/Tmp/tmp1/a.out 


Breakpoint 1, main () at a.c:4 


4 y-2j 

一 切 正常 。 但 是 假设 现在 添加 一 行 源 代 公 。 

1 main() 

> { int x,y; 

8 X = 1; 

! X++; 

5 y= 2; 

6 } 

然后 重新 编 详 《同样 ， 记 住 并 没有 离开 GDB)， 并 再 次 执行 GDB 的 run 命 令 。 
(gdb) r 


The program being debugged has been started already. 

Start it from the beginning? (y or n) y 
"/usr/home/matloff/Tmp/tmpi/a.out' has changed; re-reading symbols. 
Starting program: /usr/home/matloff/Tmp/tmp1/a.out 


Breakpoint 1, main () at a.c:4 


4 Xt 
GDB 确 实 重 新 加 载 了 新 代码 ， 但 是 断 点 似乎 从 下 面 的 语句 : 
y-2 





移 到 了 如 下 语句 : 


X++; 
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仔细 看 一 下 将 发 现 断 点 实际 上 根本 没有 移动 : 断 点 本 来 在 第 4 行 ， 现 在 仍然 在 第 4 行 。 但 是 那 
一 行 不 再 是 原来 在 其 上 设置 断 点 的 语句 。 因 此 ， 需要 通过 删除 这 个 断 点 并 设置 一 个 狐 断 点 来 移动 
靳 点 。CDDD 中 的 做 法 容易 得 多 ， 参 见 2.7.5 季 。) 

最 后 ,假设 因为 该 吃饭 、 睡 觉 或 休息 ， 而 需要 结束 当前 调 斌 会话。 如果 你 一 般 没 有 持续 开机 
的 习惯 ， 束 需要 退出 调试 莫 。 有 没有 什么 方法 可 以 保存 汤 点 呢 ? 

对 于 GDB 和 DDD， 在 某 种 程度 上 答案 是 肯定 的 。 可 以 将 断 点 放 在 源 代码 所 在 目录 (或 者 从 
中 调用 GDB 的 目录 ) 的 .gdbinit 启 动 文件 中 。 

如 果 在 使 用 Eclipse， 则 比较 笠 运 ， 因 为 所 有 上 断 点 都 会 被 目 动 保存 ， 并 且 在 下 一 个 Eclipse 会 话 
中 恢复 。 


2.7 ”删除 和 禁用 断 点 


在 调试 会 话 期 间 ， 有 时 会 发 现 有 的 断 点 不 再 有 用 。 如 采 人 确认 不 再 需要 该 断 点 ， 可 以 删除 它 。 

也 可 能 是 这 样 的 情况 : 你 认为 断 点 会 在 调试 会 话 乙 后 还 有 用 ， 也 许 你 不 想 删 除 断 点 ， 而 是 打 
算 将 它 虚 置 起 来 ， 让 调试 器 暂时 不 会 在 该 断 点 处 中 断 。 这 称 为 茶 用 断 点 。 如 果 以 后 再 次 需要 ， 可 
DA og HIS es. 

As B SP ZR RAVER HIE. ESE 71) Z1 ERE EPEE H T HU eae 


2.7.1 在 GDB 中 删除 断 点 


如 果 确 认 不 再 需要 当前 断 点 (也许 是 因为 修复 了 那个 特定 程序 错误 ), 那么 可 以 删除 该 断 点 。 
GDB 中 有 两 个 用 来 删除 断 点 的 命令 delete 命 令 用 来 基于 标识 符 删 除 断 点 , clear 命 令 使 用 与 2.4.1 
市 所 介绍 的 创建 断 点 相同 的 语法 删除 断 点 。 

€ delete breakpoint List 

删除 断 点 使 用 数值 标识 符 〈 已 经 在 2.3 节 介绍 )。 断 点 可 以 是 一 个 数字 ， 比 如 delete 2 删除 第 
二 个 断 点 ; 也 可 以 是 一 系列 数字 ， 比 如 delete 2 4 删除 第 二 个 和 第 四 个 断 点 。 

@ delete 

BRAT AW. PRIEST set confirm off 命 令 〔( 它 也 可 以 放 在 .gdbinit 启 动 文 件 中 )， 否 则 
GDB 会 要 求 确 认 删 除 操 作 。 

€ clear 

消除 GDB 将 执行 的 下 一 个 指令 处 的 断 点 。 这 种 方法 适用 于 要 删除 GDB 已 经 到 达 的 断 点 的 情 
Di. 


€ clear function, clear filename:function, clear Line number Je clear filename: 





















































Line number 
这 些 命令 根据 位 置 清除 断 点 ， 工 作 方式 与 对 应 的 break 命 令 相 似 。 
例如 ， 假 设 使 用 如 下 命令 在 foo() 的 入 口 处 设置 断 点 。 


(gdb) break foo 
Breakpoint 2 at 0x804843a: file test.c, line 22. 
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可 以 用 来 删除 该 断 点 的 代码 为 : 


(gdb) clear foo 
Deleted breakpoint 2 


或 者 


(gdb) delete 2 
Deleted breakpoint 2 


2.7.2 ”在 GDB 中 禁用 断 点 


每 个 断 点 都 可 以 被 启用 或 禁用 。 只 有 当 GDB 遇 到 局 用 的 断 点 时 ， 才 会 暂停 程序 的 执行 ; 它 会 
忽略 茶 用 的 断 点 。 默 认 情 况 下 ， 上 断 点 的 生命 期 从 局 用 时 开始 。 

ATA BAA Ae? 在 调试 会 话 期 间 , 会 遇 到 大 量 断 点 。 对 于 经 名 重复 的 循环 结构 或 函数 ， 
这 种 情况 使 得 调试 极 不 方便 。 如 果 要 保留 断 点 以 便 以 后 使 用 ， 同 时 又 不 希望 GDB 停 止 执行 ， 可 以 
禁用 它们 ， 在 以 后 需要 时 再 局 用 。 

使 用 disable breakpoint-List 命 令 禁 用 汤 点 ， 使 用 enable breakpoint-Listíi- HATA, 
其 中 preakpoint-List 是 由 空格 分 阳 开 的 多 个 断 点 标识 从 。 例 如 ， 


(gdb) disable 3 














将 禁用 第 三 个 断 点 。 类 似 地 ， 
(gdb) enable 1 5 


将 局 用 第 一 个 和 第 五 个 断 点 。 

不 市 任何 参数 地 执行 disable 命 令 将 禁用 所 有 现存 断 点 。 类 似 地 ， 不 市 参数 地 执行 enable 命 
RSA PTA SA IT o 

还 有 一 个 enable once, ZA FARI DEGDBTITEIATTIRASHI UE. WEN: 











enable once breakpoint-list 





MU, enable once 3 会 使 得 断 点 3 在 下 次 导致 GDB 停 止 程序 的 执行 后 被 禁用 。 这 个 命令 与 
tbreak 命 令 非 常 类 似 ， 但 是 当 过 到 汤 点 时 ， 它 是 禁用 断 点 ， 而 不 是 删除 断 点 。 


2.7.3 在 DDD 中 删除 和 禁用 断 点 


在 DDD 中 删除 断 点 与 设置 断 点 一 样 方便 。 与 设置 断 点 时 一 样 ， 将 光标 放 在 红色 俘 止 符号 上 ， 
并 右 击 鼠标 。 弹 出 菜单 中 将 有 一 个 选项 是 Delete Breakpoint。 按 住 鼠 标 右键 ， 并 拖 动 鼠 标 ， 直 到 
突出 显示 这 个 位 置 。 然 后 释放 鼠标 投 键 ， 将 看 到 红色 停止 符号 消 失 了 ， 表 示 断 点 已 被 删除 。 

在 DDD 中 禁用 断 点 与 删除 断 点 非常 相似 。 右 击 并 按 住 红色 停止 从 写 ， 并 选择 Disable 
Breakpoint。 红 色 停 止 符号 会 变 成 灰色 ， 表 示 断 点 仍然 存在 ， 但 已 经 葵 用 了 。 
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还 可 以 使 用 DDD 的 Breakpoints and Watchpoints 窗 口 ， 如 图 2-1 所 示 。 可 以 单 击 断 点 入 口 来 突 
出 显示 ， 然 后 选择 Delete、Disable 或 Enable。 

事实 上 ， 可 以 通过 将 鼠标 拖 到 上 面 来 突出 显示 该 窗口 中 的 几 个 条 目 ， 如 图 2-3 所 示 。 因 此 可 
以 立即 删除 、 芭 用 或 司 用 多 个 断 点 。 








DDD 7home;nmjDebug/Book7main.c 


#include «stdio.h 


void swap(int *a, DDD: Breakpoints and Watchpoints 


int main(void) x m NC MIN NT 2 
Disp Enb Address 


JY || breakpoint ^ keep y ^ Ox080483ad in main al 

intu eds [breakpoint already hit 1 time _ | 

printf( 1: %a,| PEE keep EE 

Q swap(&i, &j); | EAEE RN 

printf("i: %d,|Ħ3 breakpoint keep y 0x08048400 in swap a 
{breakpoint already hit 1 time 





return 0; 


(gdb) cont 
Te aS jr 





Breakpoint 2, main () at main.c:13 
(gdb) 











图 2-3 在 DDD 中 删除 /禁用 /局 用 多 个 断 点 


当 在 断 点 窗口 中 单 击 Delete 按 钮 后 , 屏幕 看 上 去 如 图 2-4 所 示 。 显 然 , 有 两 个 老 断 点 现在 消失 了 。 


DDD: /home/nm/Debug/Book/ main.c 











finclude «stdio.h 
void swap(int *a, 
int main(void) prove Lookup Prat. miU Diese pete 
{ Num Type Disp Enb Address What 

3 breakpoint keep y Ox08048400 in swap a 
übreakpoint already hit 1 time 


int T 23 

Tnt. j 25; 
printf("i: 96d, 
swap(&i, &j); 


printf("i: Xd, 


return 0; 


"a wy gu 


Breakpoint 2, main () at main.c:13 
(gdb) delete 1 2 
(gdb) 











图 2-4 两 个 被 删除 的 断 点 
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2.7.4 在 Eclipse 中 删除 和 禁用 断 点 


与 在 DDD 中 一 样 , 可 以 在 Eclipse 中 通过 单 击 当 前 活动 的 代码 行 中 的 断 点 符号 来 删除 或 禁用 断 
点 。 这 时 会 弹出 一 个 菜单 ， 如 图 2-5 所 示 。 注 意 ，Toggle 选 项 意味 着 删除 断 点 ， 而 Disable/Enable 
的 意思 显而易见 。 




















二 Debug - insert_sorUins<c - Eclipse Platform BEE 
File Edit Refactor Navigate Search Project Run Window Help 

| Car B |$- 07 Q |e | Bir Fle - Or Or E |%Debug]  ” 
($5 Debug 2N = D |o Breakpoints 23 \ 6% Variables | E 








Be xXexwm5sgv- 
© /workspace/insert_sort/ins.c [line: 30] 















































I moort (vy [ rim i1) 
f 
| Toggle Breakpoint 











in 
Disable Breakpoint € num. inputs : int 
Breakpoint Properties... € num y: int 
e t args(int, char**) : void 
Add Bookmark... get-arg 
Add Task... 


9 scoot over(int) : void 
RETE PENES 











(B [ZI Show Quick Diff Shift+Ct+Q 
N O Show Line Numbers 


J- r$ 








Folding 








Preferences... 




















Writable Smart Inset 52:24 


图 2-$ 在 Eclipse 中 删除 /禁用 断 点 





类 似 于 DDD 的 断 点 窗口 ，Eclipse 有 Breakpoint 视 图 ， 在 图 2-5 所 示 界 面 的 右上 方 。 与 DDD 中 需 
要 请 求 Breakpoints and Watchpoints 窗 口 的 情况 不 同 ，Eclipse 的 Breakpoints 视 图 是 在 Debug 透 视 儿 
中 目 动 显示 的 。( 不 过 ， 如 采 屏 项 空间 不 够 ， 可 以 单 击 右上 省 的 X 将 它 隐 茂 起 来 。 如 末 以 后 要 使 
它 恢 复 ， 选 择 Window 一 Show Views 一 Breakpoints。) 

Eclipse Breakpoints 视 图 的 优点 是 可 以 单 击 双 X 图 标 (Remove All Breakpoints ) 。 在 编程 过 程 中 
需要 这 么 做 的 机 会 往往 比 你 想象 的 要 多 。 在 长 调试 会 话 中 的 有 些 地 方 , 会 发 现 你 以 前 设置 的 断 点 
现在 没有 一 个 是 有 用 的 ， 因 此 要 把 它们 全 部 删除 。 

2.7.5 fEDDD# “tah” MA 


DDD 的 另 一 个 真正 优秀 的 功能 是 拖 放 断 点 。 单 击 并 按 住 源 窗口 中 的 断 点 停止 符号 ， 只 要 保持 
按 下 鼠标 左 键 ， 就 可 以 将 断 点 拖 到 源 代 码 中 的 男 一 个 位 置 。“ 莫 后 ”凡生 的 事情 是 DDD 删 除了 原 
来 的 断 点 ， 并 设置 了 一 个 具有 相同 属性 的 新 断 点 。 因 此 ， 你 将 发 现 新 断 点 与 老 断 点 完全 相同 ， 只 
是 数字 标识 符 不 同 。 当 然 ， 也 可 以 使 用 GDB 做 这 件 事 ， 但 是 DDD 加 速 了 这 一 过 程 。 

图 2-6 说 明了 这 一 点 ， 这 是 在 断 点 移动 操作 中 的 截图 。 下 面 的 代码 行 上 原来 有 一 个 断 点 。 


if (new y < y[i]) { 


我 们 希望 将 该 断 点 移 到 如 下 这 行 代 码 上 。 



































图 灵 社 区 会 员 cindy282694 EF 尊重 版 权 





54 第 2 章 停 下 来 环顾 程序 
v | DDD: /root/Debug/ins.c 


ins.c:3% S) 


y[k] = y[k-11; 


void insert(int new y) 
Lt dne: 


if (num y = 0) { // y empty so far, easy case 
y[0] = new y; 


return; 


// need to insert just before the first y 
// element that new v is less than 
for (j = 0; J « numy; je t€ 
if (new y < y[j]) € 
// shift yO. yH. * y Saar 
// before inserting n 
scoot over(j); 
y[j] = new y; 
return; 





void process dataQ 
i ser 0; num y < num inputs; num y) 
// among y[0 [num y-1] 
Tert cathun o Di 


rd BE joe rusa es) 


for (i « num inputs; i++) 
ainet sii" yl 13; 


GNU DDD 3.3.11 ‘ot Ting gna by Dorothea LUsing host libthread db 
Hear SL A db.so 

(gdb) break in ? 

Breakpoint 1 i 028048467: file ins.c, line 3?. 

(gdb) I 





图 2-6 ÆDDDP "4929" WA 
scoot over(j); 


PON ae AST ERSE Ss, JPR EH Bere E. FEA, BOMBA PE il is 
fee, Db. JOR ANE ILA S VPA EARL, GT Eth TA “28” BRIERE Ss. — ERE de 
键 ， 老 代码 行 上 的 停止 符号 驶 会 消失 ， 新 行 上 出 现 一 个 停止 符号 。 

为 什么 这 样 做 很 有 用 呢 ?” 痛 先 ， 如 果 处 于 要 删除 一 个 断 点 并 添加 男 一 个 断 点 的 情况 下 ， 这样 
可 以 一 气 呵 成 完成 两 个 操作 。 但 是 更 重要 的 是 ， 如 2.6 厄 所 提 到 的 那样 ， 当 添加 或 删除 源 代码 行 
时 ， 有 部 分 行 的 行 号 发 生 了 变化 ， 从 而 将 现 有 上 断 点 “转移 到 ”了 不 打算 设置 断 点 的 行 上 。 在 GDB 
中 ， 这 束 需 要 在 每 个 受 影 啊 的 断 点 处 进行 删除 断 点 和 创建 新 断 点 的 操作 。 这 样 做 是 很 索 琐 的 ， 尤 
其 是 当 部 分 断 点 有 附加 条 件 时 更 麻烦 。 但 是 在 DDD 中 ,可 以 直接 将 停止 符号 图 标 拖 到 新 位 置 ， 这 
样 操 作 非 党 方便 。 

2.76 DDD 中 的 Undo/Redo 断 点 动作 


MEN 可 通过 单 击 Edit 用 到 。 以 图 2-3 和 图 2-4 中 的 情况 为 
例 。 假 设 你 突然 意识 到 不 想 删 除 那 两 个 断 点 (也 许 只 是 希望 禁用 它们 )， 可 以 选择 Edit 一 Undo 
Delete, E (也 可 以 单 击 命 令 工 具 中 的 Undo， 但 是 通过 Edit 访 问 会 更 好 ， 这 样 DDD 会 
提醒 我 们 将 撤销 什么 操作 。) 
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DD: Breakpoints and Watchpoints 


Disp Enb Address t 
3 breakpoi nt keep y .0x08048400 in swap a 














图 2-7 在 DDD 中 恢复 两 个 断 点 


2.8 ”进一步 介绍 浏览 断 点 属性 


每 个 断 点 都 有 各 种 属性 一 一 行 写 、 加 在 断 点 上 的 条 件 (如 果 有 的 话 》、 m 
RA ]14E2.3 PSP A Y — SUL T ER ERES S PERS PIE, MERATE AE 


2.8.1 GDB 


2.3.1 节 中 介绍 过 , GUEEBUREA Br na PS BUR ME A s 设置 的 第 一 个 断 点 被 赋予 
“1” 其 后 的 每 个 新 断 点 都 被 赋予 上 一 个 标识 符 加 1。 每 个 断 点 也 有 一 些 控制 调整 其 行为 的 属性 。 
使 用 唯一 标识 符 ， 可 以 分 别 调整 各 个 断 点 的 属性 。 

可 以 使 用 info breakpoints 命 令 〈 简 写 为 1 b) 来 列 出 设置 的 所 有 上 断 点 及 其 属性 。info 
breakpoints 的 输出 看 上 去 大 体 如 下 : 


(gdb) info breakpoints 























Num Type Disp Enb Address What 

1  breakpoint keep y | 0x08048404 in main at int swap.c:9 
breakpoint already hit 1 time 

2 breakpoint keep n | 0x08048447 in main at int swap.c:14 

3  breakpoint keep y 0x08048460 in swap at int swap.c:20 
breakpoint already hit 1 time 

4 hw watchpoint keep y counter 


让 我 们 详细 分 析 一 下 info breakpoints 的 这 一 输出 。 
(1) 标识 符 (Num): 断 点 的 唯一 标识 符 。 
(2) 类 型 (Type): 这 个 字段 指出 该 断 点 是 断 点 、 监 视点 还 是 捕获 点 。 


图 灵 社 区 会 员 cindy282694 专 享 尊重 版 权 





56 — $23 停 下 来 环顾 程序 





(3) 部 署 〈Disp): 每 个 断 点 都 有 一 个 部 署 ， 指 示 断 点 下 次 引起 GDB 和 暂停 程序 的 执行 后 该 断 点 
上 会 发 生 什么 事情 。 可 能 的 部 署 有 以 下 3 种 。 

O 保持 (keep)， 下 次 到 达 断 点 后 不 改变 断 点 。 这 是 新 建 断 点 的 默认 部 署 。 

O 删除 (del)， 下 次 到 达 断 点 后 删除 该 断 点 。 使 用 tbreak 命 令 创 建 的 任何 断 点 都 是 这 样 的 

rex CUL2.4.1 15). 
O 禁用 (dis)， 下 次 到 达 断 点 时 会 禁用 该 断 点 。 这 是 使 用 enable once 命 令 设 置 的 断 点 〈 见 
2 

(4) 局 用 状态 (Enb): 这 个 学 段 说 明 断 点 当前 是 局 用 还 是 禁用 的 。 

(5) 地 址 〈Address): 这 是 内 存 中 设置 断 点 的 位 置 。 它 主要 供 汇编 语言 程序 员 或 者 试图 调试 
没有 用 扩充 的 符号 表 编 译 的 可 执行 文件 的 人 使 用 。 

(6) MLE (What): 正如 我 们 讨论 过 的 ， 各 个 断 点 位 于 源 代 码 中 的 特定 行 上 。What 字 段 显示 了 
断 点 所 在 位 置 的 行 号 和 文件 名 。 

对 于 监视 点 ， 这 个 字段 表示 正在 监视 哪个 变量 。 因 为 变量 实际 上 是 带 名 称 的 内 存 地 址 ， 而 内 
存 地 址 则 是 一 个 位 置 。 

可 以 看 到 ， 除 了 列 出 所 有 上 断 点 及 其 属性 ， 使 用 i b 命 令 也 能 指出 特定 断 点 引起 GDB 停 止 程序 
执行 多 少 次 。 例 如 ， 如 果 循 环 中 有 一 个 断 点 ， 这 个 命令 马上 会 告诉 你 到 目前 为 止 循环 执行 了 多 少 
次 迭代 ， 这 会 非常 有 用 。 

2.8.2 DDD 


从 图 2-1 中 可 以 看 出 ，DDD 的 Breakpoints and Watchpoints 窗 口 提供 的 信息 与 GDB 的 info 
breakpoints 命 令 提供 的 信息 相同 。 然 而 ，DDD 的 窗口 方式 比 GDB 的 命令 更 方便 ， 因 为 可 以 经 各 
性 地 显示 这 个 窗口 〈 即 将 它 放 在 屏 项 边 上 )， 因 此 不 需要 在 每 次 要 奏 看 断 点 时 都 执行 命令 。 

2.8.3 Eclipse 


再 次 ， 如 前 面 图 2-2 所 示 ，Eclipse 的 Breakpoints 视 图 可 以 经 滑 地 显示 断 点 及 其 属性 。Eclipse 
的 信息 比 DDD 的 信息 略 少 ， 因 为 它 没有 指出 到 目前 为 止 已 遇 到 断 点 多 少 次 〈 甚 全 Properties 窗 口 
中 都 没有 这 一 信息 )。 


2.9 恢复 执行 


知道 如 何 指示 调试 圳 在 何 处 或 何 时 暂停 程序 的 执行 很 重要 , 但 是 知道 如 何 指示 调试 磊 恢 复 执 
行 同样 重要 。 毕 竟 ， 仅 仪 查 看 变量 可 能 不 够 。 有 时 需要 知道 变量 的 值 是 如 何 与 代码 的 其 余部 分 交 
互 的 。 

我 们 在 第 1 革 介 绍 过 确认 原则 : 要 一 处 处 确认 攻坚 变 量 有 你 认为 它们 应 该 具有 的 值 ， 直 人 至 过 
到 一 个 与 你 的 预期 不 符 之 处 。 然 后 这 种 不 符 将 是 一 种 线索 ， 很 可 能 加 是 程序 错误 所 在 的 位 置 。 但 
征 通 币 这 种 不 待机 经 过 多 个 断 点 处 暂 俘 并 恢复 执行 时 才 会 友 生 《或 者 在 同一 个 断 氮 上 多 次 暂停 并 
恢复 )。 因 此 ， 在 断 点 处 恢复 执行 与 设置 断 点 本 喘 同 样 重 要 ， 这 吏 是 为 什么 调试 工具 通 钊 会 有 相 
当 丰 军 的 恢复 执行 的 方法 。 
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恢复 执行 的 方法 有 3 类 。 第 一 类 是 使 用 step 和 next“ 单 步 ” 调 试 程序 ， 仪 执行 代码 的 下 一 行 
然后 再 次 暂停 。 第 二 类 由 使 用 continue 组 成 ， 使 GDB 无 条 件 地 恢复 程序 的 执行 ， 直 到 和 它 遇 到 另 
一 个 断 点 或 者 程序 结束 。 最 后 一 类 方法 涉及 条 件 : 用 finish 或 until 命 令 恢复 。 在 这 种 情况 下 ， 
GDB 会 恢复 执行 ， 程 序 继续 运行 下 到 遇 到 某 个 预先 确定 的 条 件 《〈 比 如 ， 到 达 函 数 的 末尾 )， 或 者 
到 达 另 一 个 断 点 ， 或 者 程序 完成 。 

下 面 将 依次 介绍 GDB 的 各 种 恢复 执行 的 方法 ， 然 后 介绍 如 何在 DDD 和 Eclipse 中 执行 这 样 的 
BRE. 

2.9.1 在 GDB 中 


本 方 站 和 完 讨 论 GDB 在 断 点 处 暂 仿 后 的 各 种 恢复 执行 的 方法 。 

1. 使 用 step 和 next 单 步调 试 

一 旦 GDB 在 断 点 处 停止 ， 可 以 使 用 next( 人 简写 为 %) 和 step〈 人 简写 为 s) 命令 来 单 步调 试 代码 。 
当 触 发 了 断 点 ， 并 且 GDB 和 暂停 后 ， 可 以 使 用 next 和 step 来 执行 紧 接 着 的 下 一 行 代 人 码 。 当 执行 了 这 
一 行 后 ，GDB 会 再 次 上 斩 仓 ， 并 给 出 一 个 命令 行 提示 符 。 让 我 们 看 一 下 这 一 过 程 鸭 实际 使 用 ， 来 看 
代码 清单 2-1。 


代码 清单 2-1  swapflaw.c 


1 /* Swapflaw.c: A flawed function that swaps two integers. */ 
» #include <stdio.h> 
s void swap(int a, int b); 























int main(void) 


{ 


7 int 1 = 4; 

8 int j = 6; 

9 

10 printf("i: %d, j: dl s i, j); 
n swap(i, j); 


12 printf("i: 4d, j: %d\n", i, j); 


i return 0; 


is} 
i7 void swap(int a, int b) 


C = ð; 
20 a = b; 
C; 


我 们 将 在 main() 的 入 口 处 设置 一 个 断 点 ， 并 在 GDB 中 运行 程序 。 
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$ gcc -g3 -Wall -Wextra -0 swapflaw swapflaw.c 

$ gdb swapflaw 

(gdb) break main 

Breakpoint 1 at 0x80483f6: file swapflaw.c, line 7. 
(gdb) run 

Starting program: swapflaw 

Breakpoint 1, main () at swapflaw.c:7 

7 int i = 4; 


GDB 现 在 位 于 程序 的 第 7 行 , 这 意味 看 第 7 行 还 没有 执行 。 我 们 可 以 使 用 next 命 令 来 执行 这 行 
代码， 这 样 来 到 第 8 行 前 面 : 








(gdb) next 

8 int j = 6; 

我 们 将 使 用 step 来 执行 下 一 行 代 码 ( 第 8 行 )， 执 行 后 使 我 们 移 到 第 10 行 。 
(gdb) step 

10 printf("i: %d, j: %d\n", i, j); 





我 们 看 到 next 和 step 都 能 执行 下 一 行 代 码 。 因 此 一 个 重要 问题 是 :“ 这 两 个 命令 的 不 同 之 处 
在 哪里 ? ”它们 似乎 都 能 执行 下 一 行 代码 。 这 两 个 命令 的 区 别 是 它们 如 何 处 理 函 数 调用 : next 
执行 函数 ， 不 会 在 其 中 暂停 ， 然 后 在 调用 之 后 的 第 一 条 语句 处 和 暂停， 而 step 在 函数 中 的 第 一 个 语 
名 处 暂 俘 。 

对 swap() 的 调用 出 现在 第 11 行 。 让 我 们 比较 一 下 next 和 step 的 效果 。 








使 用 step : 使 用 next : 

(gdb) step (gdb) next 

wA uu i: 4, j: 6 

11 swap(i, j); 11 swap(i, j); 
(gdb) step (gdb) next 

swap (a-4, b-6) at swapflaw.c:19 12 printf("i: 4d, j: 4d\n", i, j); 
19 int c = a; (gdb) next 

(gdb) step 1i: 4, j: 6 

20 a-b; 14 return 0; 
(gdb) step 

21 b=c; 

(gdb) step 

22 } 

(gdb) step 

main () at swapflaw.c:12 

12 printf( 12: 4d, j: %d\n", i, j); 

(gdb) step 

i 33.7]: 

14 return 0; 
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step 命 令 的 运行 方式 与 你 预期 的 可 能 一 样 。 该 命令 在 第 10 行 执行 printf(), 然后 在 第 11 行 * 调 
用 swap()， 然 后 它 开 始 执行 swap() 中 的 代码 行 。 这 称 为 单 步 进入 (stepping into) 函数 。 一 旦 我 们 
用 step 授 历 了 swap() 的 所 有 代码 行 ，step 束 会 把 我 们 禹 回 到 main()。 

相反 地 ， 似 乎 next 永 远 不 会 离开 main()。 这 是 两 个 命令 的 主要 区 别 。next 将 函数 调用 看 做 一 
行 代码 ， 并 在 一 个 操作 中 执行 整个 函数 ， 这 称 为 单 步 越过 (stepping over) PAA. 

然而 , 不 要 受 假 相 蒙蔽 。 虽然 看 上 去 似乎 next 越 过 了 swap() 的 主体 , 但 是 它 并 未 真 的 单 步 “ 越 
过 ”任何 内 容 。GDB 安 静 地 执行 swap() 的 每 一 行 ， 不同 我 们 显示 任何 细节 (虽然 它 显 示 了 swap() 
可 以 输出 的 任何 屏 天 输出 )， 并 且 没 有 提示 我 们 执行 函数 中 的 各 行 代码 。 

单 步 进入 函数 〈step 命 令 的 操作 ) 和 早 步 越过 函数 (next 命令 的 操作 ) ZIAD AY PES AE AH 25 5 
要 的 概念 ， 所 以 为 了 不 大 其 烦 地 强调 其 重要 性 ， 我们 用 图 来 演示 next 和 step 之 则 的 区 列 ， 图 中 用 
篆 头 显示 程序 执行 顺序 。 

图 2-8 说 明了 step 命 令 的 行为 。 想 象 一 下 程序 在 第 一 个 printf() 语 句 处 暂停 。 该 图 显示 了 各 
个 step 语 句 会 将 我 们 市 到 何 处 。 



































int main(void) 


int i 
int j 


printf("i: Xd. j: %d\n", i, j}; MN step 
swap(i, j); 


printf("i: Xd, j: %d\n", i, j); 


return 0; 


l 


void swap(int a, int b) 





图 2-8 step. HEA pe 


图 2-9 说 明了 同样 的 事情 ， 不 过 使 用 的 是 next。 

应 该 使 用 next 还 是 step， 取 雇 于 要 做 的 事情 。 如 宋 是 在 没有 函数 调用 的 那 部 分 代码 中 ， 那 么 
可 以 随意 。 这 时 两 个 命令 是 完全 相同 的 。 

然而 ， 如 果 调 试 中 要 单 步 进 入 一 个 你 知道 没有 程序 错误 (或 者 与 你 在 试图 跟踪 的 程序 错误 无 

















CD 你 可 


能 会 疑惑 , 为 什么 step 没 有 将 你 带 到 函数 printf() 的 第 一 行 。 原因 是 GDB 不 会 在 不 具有 调试 信息 的 代码 ( 即 
符号 表 ) 内 


停止 。 从 C 库 中 引入 的 函数 printf() 是 这 样 的 一 个 代码 示例 。 
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AO 的 函数 中 ， 那 么 显然 使 用 next 可 以 避免 单 步调 试 该 函数 的 每 一 行 。 


int main(void) 


int i = 4; 
int j = 6; 


printf( 3: Xd, j: %d\n", i, j); 3 next 
swap(i, j); 
printf("i: %d, j: 4dWn", i, j); p ——» next 


return 0; 


} 


void swap(int a, int b) 





图 2-9 next PERSE pk ay 


2B 1 LA — Asc i i J WZ ERA ED I] BS ETT I. QR CE Yl AS EY a FI 
国 数 调用 ， 那 么 一 般 使 用 next 比 使 用 step 更 好 。 在 这 种 情况 下 使 用 next 之 后 ， 立 即 要 检查 调用 的 
结果 是 否 正 确 。 如 果 正 确 ， 那 么 程序 错误 很 可 能 不 在 函数 中 ， 这 意味 看 使 用 next 而 不 是 step 能 够 
节省 单 步调 试 每 一 行 的 时 间 和 精力 。 为 一 方面 ， 如 果 函 数 的 结果 不 正确 ， 可 以 在 函数 调用 时 设置 
一 个 临时 断 点 来 重新 运行 程序 ， 然 后 用 step 进 入 函数 。 

next 和 step 命 令 都 采用 一 个 可 选 的 数值 参数 ， 表 示 要 使 用 next 或 step 执 行 的 额外 行 数 。 换 言 
Z, next 3 与 在 一 行 中 键入 next 三 次 (或 者 键入 next 一 次 ， 然 后 按 下 ENTER 键 两 次 ) 的 作用 相 
I]. “图 2-10 说 明了 next 3 的 作用 。 




















void swapper(int *a, int *b) 


intg eqs 

Kg = *b; 

*h = ps next 3 
printf("swapped!\n"); 


图 2-10 iXX next 





(D Vim 用 户 应 该 很 习惯 指定 给 定 命令 次 数 的 含义 。 
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2. 使 用 continue 恢 复 程序 执行 

第 二 种 恢复 执行 的 方法 是 使 用 continue 命 令 ， 和 位 写 为 c。 与 仅 执 行 一 行 代 人 码 的 step 和 next 相 
反 ， 这 个 命令 使 GDB 恢 复 程 序 的 执行 ， 直 到 触发 断 点 或 者 程序 结束 。 

continue 命 令 可 以 接受 一 个 可 选 的 整数 参数 nh。 这 个 数字 要 求 GDB 名 上 略 下 面 n 个 断 点 。 例 如 ， 
continue 3 让 GDB 恢 复 程 序 执 行 ， 并 忽略 接 下 来 的 3 个 断 点 。 

3. 使 用 finish 恢 复 程序 执行 

一 旦 触发 了 断 点 ， 束 使 用 next 和 step 命 令 逐 行 执 行程 序 。 有 了 时 这 是 一 个 痛 苗 的 过 程 。 例 如 ， 
假 议 GDB 到 达 了 函数 中 的 一 个 断 点 。 你 已 查看 了 几 个 变量 ， 并 且 收 集 了 需要 的 所 有 信息 。 这 上 时， 
你 没有 兴趣 也 不 需要 蛙 步 调试 函数 的 其 余部 分 , 想 返 回 到 这 个 函数 之 前 GDB 上 所 在 的 调用 函数 。 然 
而 ， 如果 要 做 的 只 是 跳 过 函数 的 其 余部 分 ， 那么 再 设置 一 个 无 关 汤 点 并 使 用 continue 似 乎 比较 浪 
费 。 这 时 应 该 使 用 finish 命 令 。 

finish 命 令 〈 简 写 为 fin) 指示 GDB 恢 复 执行 ， 直 到 恰好 在 当前 栈 帧 完成 之 后 为 止 。 也 天 是 
说 ， 这 和 意味 看 如 果 你 在 一 个 不 是 main() 的 函数 中 ，finish 命 令 会 导致 GDB 恢 复 执 行 ， 直 到 恰好 在 
函数 返回 之 后 为 止 。 图 2-11 说 明了 finish 的 使 用 。 




















void swapper(int *a, int *b) 


lint c = "a; 

Ka = *b; 

“b ~ E + » 
printf("swapped!Nn"); finish 








图 2-11 finish 恢 复 执行 ， 直 到 当前 函数 返回 为 止 


虽然 可 以 键入 next 3 而 不 是 finish， 但 是 键入 后 者 更 容易 ， 这 样 会 对 行进 行 计数 〈6 行 以 上 
的 内 容 都 显得 多 余 )。 

看 上 去 finish 似 乎 没有 执行 每 一 行 代码， 因为 它 将 你 带 到 了 疯 数 的 压 部 , 但 是 实际 上 它 执 行 
了 每 一 行 代 码 。 除 非 为 了 显示 程序 的 输出 ， 否 则 GDB 执 行 每 行 代码 时 不 会 暂停 ”。 

finish 的 男 一 个 常见 用 途 是 当 不 小 心 单 步 进 入 原本 希望 蛙 步 越过 的 函数 时 (换言之 ， 当 需要 使 
用 next 时 使 用 了 step)。 在 这 种 情况 下 ， 使 用 finish 可 以 将 你 正好 放 回 到 使 用 next 会 到 的 位 置 。 

如 末 在 一 个 加 归 函 数 中 ，finish 只 会 将 你 禹 到 递归 的 上 一 层 。 这 是 因为 每 次 调用 都 外 看 做 是 
一 次 函数 调用 ， 因 为 每 次 调用 都 有 各 目的 栈 帧 。 如 果 要 在 递归 层次 较 高 时 完全 退出 递归 函数 ， 那 
么 更 适合 使 用 临时 断 点 及 continue， 或 者 用 until1 命 令 。 下 面 我 们 将 讨论 until。 

4. 使 用 until 恢 复 程 序 执行 

表面 介绍 过 ，finish 命 令 在 不 进一步 在 图 数 中 暂停 〈 除 了 中 间断 点 ) 的 情况 下 完成 当前 函数 
KIHT. XA, utilas (ASN) 通常 用 来 在 不 进一步 在 循环 中 暂停 (除了 循环 中 的 中 间 





























O 如 果 有 任何 介 于 其 间 的 断 点 ，finish 都 会 在 其 上 暂停 。 
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Wr) 的 情况 下 完成 正在 执行 的 循环 。 来 看 如 下 代码 厂 断 。 


...previous code... 


int i - 9999; 

while (i--) { 
printf("i is %d\n", i); 
seer lots of code «ss 

} 


...future code... 

假 议 GDB 在 while 语 句 的 一 个 断 点 上 俘 止 , 你 查看 了 一 些 变 量 , 现在 打算 离开 循环 来 调试 “未 
来 的 代码 ”。 

问题 是 i 相当 大 ， 使 用 next 来 完成 循环 不 是 办 法 ， 而 又 不 能 用 finish， 因 为 该 命令 正好 通过 
“未 来 的 代码 ”， 并 将 我 们 市 出 孔 数 。 在 这 种 情况 下 可 以 在 未 来 代码 处 设置 一 个 临时 断 点 并 使 用 
continue。 这 恰好 是 until 要 来 处 理 的 情况 。 

使 用 until 会 执行 循环 的 其 余部 分 ， 让 GDB 在 循环 后 面 的 第 一 行 代码 处 暂停 。 图 2-12 显 示 了 
使 用 unti1 的 情况 。 

















...previous code... 


int i - 9999; 
while (i--) { 


printf("i is %d\n", i); 
.. -lots of code... 


} 


.. suture code... 





图 2-12 unti DAS BUE SUR TRI ROPE BA 
当然 ， 如 果 GDB 在 离开 循环 前 遇 到 一 个 断 点 ， 它 就 会 在 那里 暂停 如 果 图 2-12 中 的 printf() 











语句 处 有 一 个 断 点 ， 当 然 要 茶 用 该 断 点 。 
GDB 使 用 手册 给 出 了 until 的 官方 定义 : 执行 程序 ， 直 到 到 达 当 前 循环 体外 的 下 一 行 源 代 
码 。 











然而 ， 访 文档 还 警告 ， 这 可 能 有 点 违反 直觉 。 为 了 说 明 原 因 ， 来 看 代码 清单 2-2。 


代码 清单 2-2  until-anomaly.c 


#include <stdio.h> 


int main(void) 
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t 


int i; 


for (i=0; i<10; ++i) 
printf("hello world!"); 


return 0; 


} 
我 们 将 在 main() 的 入 口 处 设置 断 点 ， 运 行程 序 ， 并 使 用 until 来 到 达 return 语 句 。 





$ gdb until-anomaly 

Using host libthread db library "/lib/tls/libthread db.so.1". 
(gdb) break main 

Breakpoint 1 at 0x80483b4: file until-anomaly.c, line 7. 
(gdb) run 

Starting program: until-anomaly 


Breakpoint 1, main () at until-anomaly.c:7 


7 for (i-0; i«10; ++i) 

(gdb) until 

8 printf("hello world!"); 
(gdb) until 

7 for (i-0; i«10; ++i) 

(gdb) until 

10 return 0; 

(gdb) 








Aya th, fiHjuntilgs, GDBAS74T2K 8028811. AJ HEET. ERIC LEN 
中 的 第 7 行 比 第 8 行 靠 后 吗 ? 实际 上 ， 底 层 确 实 如 此 。 现 在 也 许 已 经 可 以 猜 到 答案 ， 因 为 这 似乎 是 
一 个 常见 的 主题 。GDB 最 终 使 用 的 是 机 器 指令 。 虽 然 for 结 构 编写 为 在 主体 上 方 进行 循环 测试 ， 
但 是 GCC 是 使 用 循环 主体 奔 部 的 条 件 编 译 程序 的 。 因 为 该 条 件 与 源 代码 的 第 7 行 天 联 ， 所 以 GDB 
似乎 在 源 代码 中 反问 执行 了 。 事 实 上 ，until 实 际 上 做 的 是 执行 程序 ， 直 到 它 到 达 内 存 地 址 比 当 
本 内 存 地 址 更 高 的 机 器 指令 ， 而 不 是 下 到 到 达 源 代码 中 一 个 更 大 的 行 号 。 

在 实践 中 ， 这 种 情况 可 能 不 是 经 常 出 现 , 但 是 了 解 它 何 时 会 出 现 是 不 错 的 。 为 外 ， 通 过 查看 
GDB 的 一 些 奇 怪 的 行为 , 可 以 收集 关于 编译 器 如 何 将 源 代码 转换 成 机 器 指令 的 信息 (知道 一 点 这 
方面 的 知识 没有 坏处 )。 

如 果 你 比较 好 奇 ， 而 且 异 得 机 器 的 汇编 语言 ， 则 可 以 使 用 GDB 的 disassemble 命 令 ， 后面 跟 
着 p/x $pc 来 输出 当前 位 置 。? 这 样 可 以 显示 until 将 做 的 事情 。 但 是 这 只 是 一 种 特殊 的 情况 ， 在 















































CD 也 可 以 使 用 GCC 的 -s 选 项 来 查看 机 右 人 码 。 使 用 该 选项 会 产生 一 个 后 级 为 .s 的 汇编 语言 文件 , 其 中 显示 了 编译 器 产 
生 的 代码 。 注 意 ， 这 样 只 会 产生 汇编 语言 文件 ， 而 不 能 产生 可 执行 文件 。 
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实际 应 用 中 这 不 是 问题 。 如 末 在 循环 的 末尾 ， 执 行 until 命 令 寻 致 回 跳 到 循环 顶部， 这 时 上 只 要 再 
次 执行 until， 驶 可 以 离开 当前 的 循环 。 

unti1 命 令 也 可 以 接受 源 代 但 中 的 位 置 作为 参数 。 事 实 上 ， 该 命令 接受 的 参数 与 2.4.1 节 讨论 
的 break 命 令 相 同 。 回 到 代码 清单 2-1 中 ， 如 果 GDB 触 发 了 main() 入 口 处 的 一 个 断 点 ， 那 么 可 以 使 
用 下 面 这 些 命令 方便 地 使 程序 一 直 执 行 到 swap() 的 入 口 。 

Q until 17 











Q until swap 
Q until swapflaw.c:17 


Q until swapflaw.c:swap 
2.9.2 在 DDD 中 

本 节 首 先 讨论 在 断 点 处 暂停 了 DDD 后 恢复 执行 的 各 种 方式 。 

1. 标准 操作 

DDD 的 命令 工具 中 对 应 于 next 和 step 的 按钮 都 有 。 另 外 ， 可 以 分 别 使 用 F5 和 F6 功 能 键 执行 
step 和 next。 

如 果 要 在 DDD 中 使 用 带 参数 的 next 或 step， 即 通过 如 下 代码 在 GDB 中 完成 要 做 的 事 。 


(gdb) next 3 








那么 需要 在 DDD 的 控制 台 窗 口中 使 用 GDB 本 号。 

DDD 的 命令 工具 中 有 一 个 对 应 于 continue 的 按钮 ， 但 是 同样 地 ， 如 果 要 执行 带 参 数 的 
continue， 需 使 用 GDB 控 制 合 。 可 以 单 击 源 窗口 来 打开 continue until here 选 项 ， 这 样 可 以 真正 在 
源 代码 的 那 一 行 处 设置 临时 断 点 〈《 见 2.4.1 广 )。 更 精确 地 说 ，continue until heres kE *— AA 
执行 到 这 一 点 ， 但 是 在 任何 中 间断 点 处 也 集 止 ”。 

在 GDB 中 , 通过 带 数 值 参数 的 next 可 以 获得 与 finish 相 同 的 效果 ， 只 是 finish 或 多 或 少 地 方便 
一 些 。 但 是 在 DDD 中 ， 使 用 finish 是 相当 明智 的 ， 因 为 这 样 只 要 在 命令 工具 中 单 击 一 次 鼠标 即 可 。 

如 果 使 用 的 是 DDD， 则 可 以 使 用 名 为 Until on the Command Tool 的 按钮 来 执行 unti1L， 或 者 单 
击 Program 一 Until 深 单 栏 ， 也 可 以 使 用 键盘 快捷 键 F7。 在 所 有 这 些 选项 中 ， 总 会 发 现 一 种 方便 的 
方法 ! 与 其 他 很 多 GDB 命 令 一 样 ， 如 果 要 使 用 市 参数 的 until1， 只 需要 在 DDD 控 制 台 窗 口中 直接 
使 用 GDB 命 令 。 

2. Undo/Redo 

正如 2.7.6 节 介绍 的 ， DDD 有 一 个 非常 有 用 的 Undo/Redo 功 能 。 在 那 一 节 中 ， 我 们 介绍 了 如 何 
撤销 不 小 心 的 断 点 删除 。 这 种 方法 也 可 以 用 于 Run、Next、Step 等 动作 。 

例如 ， 来 看 图 2-13 描 述 的 情况 。 我 们 在 调用 swap() 时 到 达 了 断 点 ， 打 算 执 行 一 个 Step 操 作 ， 
但 是 不 小 心 持 击 了 Next 按 钮 。 直 到 这 种 情况 ， 只 要 单 击 Undo， 束 可 以 将 时 间 倒 退回 去 ， 如 图 2-14 
所 示 。 DDD 将 当前 行 的 光标 显示 为 轮廓 而 不 是 它 一 般 使 用 的 实心 绿色 ,从 而 提醒 你 撤销 了 茶 些 操 
Wes 
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iw DDD: /root/Debug/main.c 


main.c:14 + D F Y 
Pitithee 


#include <stdio.h> 
void swapCint *a, int *b); 


in main(void) 


int i = 3; 

int j = 5; 

urinet ie Sol. 35 LAM 1.395 
Qiswap(&i, aj); 

Printhe- is xd. 3e edn. 15 32 


return 0; 


1s 5325 3$ 5 


Breakpoint 4, main () at main.c:10 
(gdb) next 
(gdb) T 


图 2-13 不 小 心 按 了 Next 按 钮 


iw DDD: /root/Debug/main.c 


er 


Y 5) it a 7 > jv ; [ > 
main.c:14 NE d Q | o wA Ive "4 f 
WIIG PHUT DESS RIOT Dot HOTEL 


#include <stdio.h> 
void swapCint *a, int *b); 


int main(void) 


int i = 3; 

int j = 5; 
rn en e Md, de Sdn", T, Aa; 
Swap (ei, &j); 

printfC le gdi js $din^, 1. 33: 


return 0; 


1535 Je S 


Breakpoint 4, main () at main.c:10 
(gdb) next 
(gdb) į 


Kl2-14 ” 单 击 Undo 撤 销 上 一 个 操作 
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2.9.3 在 Eclipse 中 


Eclipse 中 对 应 于 step 和 next 命 令 的 是 Step Into 和 Step Over 图 标 。Step Into 图 标 在 图 2-15 所 示 的 
Debug 视 网 中 是 可 见 的 〈 左 上方)， 鼠 标 指针 位 置 临时 导致 了 图 标 标签 的 出 现 。Step Over 图 标 就 
年 它 右边 。 注 意 ， 将 要 执行 的 下 一 个 语句 是 对 get_args() 的 调用 ， 因 此 单 击 Step Into 会 导致 程序 
执行 的 下 次 和 暂 俘 发 生 在 该 国 数 的 第 一 个 语句 中 ， 而 选择 Step Over 意味 看 下 次 暂 俘 将 在 对 
process data() 的 调用 中 。 














File Edit Refactor Navigate Search Project Run Window Hep —- 
[= B |#7 0- Qv |e | WH 
$ Debug EN 
& d» 5mo(xjo.z|: 
v [t]insert sort Debug [C/C++ Local Ap|Step Into] 
'v È gdb/mi (12/16/07 7:55 PM) (Suspended) 
Y if? Thread [0] (Suspended) 
= 1 main /workspace/insert_sort/ins.c:63 0x08048524 
pli gdb (12/16/07 7:55 PM) 
vl /workspace/insert sort/Debug/insert sort (12/16/07 7:55 PM) 

















{9 ins.c X 
for (i = 0; i < num_inputs; i++) S 
& printf("*dWMn",v[il); % wx 
) € x.:int[] 


e V 





% ( get args(argc,argv); € num inputs : int 
process. data(); 


6 v;i 
int main(int argc, char ** argv) y: ing] 
print_results(); 


€ num y: int 
49 get args(int, char) : void 


9 scoot over(int) : void 














El Console 23 ` £i Tasks | E Problems | G Memory. 


insert sort Debug [C/C++ Local Application] /workspace/insert_sort/Debug/insert_sort (12/16/07 7:55 PM) 
then: then/endif not found. 














K|2-15 Eclipse 中 的 Step Into 图 标 


Eclipse 有 一 个 执行 finish 的 Step Return lbs (ZEStep Over) 。 它 与 until 的 功能 完全 不 一 
FF. fEEclipse'F38 7$ fii H] Run to Line 〈 通 过 单 击 目标 行 然后 在 源 代 但 窗口 中 右 击 来 调用 ) 来 完成 
希望 使 用 until 完 成 的 事 。 


2.10 条 件 断 点 


上 只 要 司 用 了 断 点 ， 调 试 豆 融 总 是 在 该 断 点 处 停止 。 然 而 ， 有 时 有 必要 告诉 调试 毅 上 只 有 当 符 合 
东 种 条 件 时 才 在 断 点 处 停 上 ， 比 如 当 变 量具 有 我 们 感 兴趣 的 东 个 特定 的 值 时 。 

这 类 似 于 监视 后 的 工作 方式 , 但 是 有 一 个 重要 区 别 。 如果 怀疑 条 个 变量 在 攻 处 得 到 了 一 个 伪 
值 ， 那 么 条 件 断 点 比 监 视点 更 利于 作 判 断 。 每 当 该 变量 的 值 发 生变 化 时 ， 监 视点 都 会 中 断 。 条 件 
靳 点 只 会 在 怀疑 有 问题 的 代码 处 当 变 量 呈 现 该 怀疑 值 时 才 中 断 。 从 这 个 意义 上 讲 ， 当 完全 不 知道 
变量 在 何 处 接受 了 伪 值 时 ， 最 好 使 用 监视 点 。 这 对 于 全 局 变量 或 者 在 函数 之 间 连 续 传 递 的 局 部 变 
量 来 说 特别 有 用 。 但 是 在 其 他 大 多 数 情况 下 ， 位 置 放 得 较 好 的 条 件 断 点 则 更 有 用 、 更 方便 。 
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2.10.1 GDB 

设置 条 件 断 点 的 语法 为 : 

break break-args if (condition) 

其 中 preak-args 是 可 以 传递 给 break 以 指定 汤 点 位 置 的 任何 参数 (如 2.4.1 节 所 讨论 的 )， 
condition 是 2.12.2 节 定义 的 布尔 表达 式 。 插 着 condition 的 圆 括号 是 可 选 的 。 圆 括 号 会 使 一 些 C 
程序 员 有 宾至如归 的 感觉 ， 但 是 你 也 可 能 喜欢 更 整洁 的 外 观 。 

例如 ， 下 面 说 明了 如 果 用 户 向 程序 中 键入 一 些 命 令 行 参 数 ， 如 何在 main() 处 中 断 ”: 























break main if argc > 1 


ATE PARA OR TR S| See FS ETA SDA A AA PAN FEST: 


for (i=0; i«-75000; ++i) { 
retval = process(i); 
do something(retval); 


} 


假设 你 知道 当 i 为 70 000 时 程序 会 陷入 混乱 ， 要 在 循环 顶部 中 断 ， 但 是 不 打算 用 next 通 过 
69 999 次 迭代 。 这 时 就 非常 适合 使 用 条 件 中 断 。 可 以 在 循环 顶部 设置 一 个 断 点 ， 但 是 只 有 当 i 等 
于 70 000 时 才 中 断 ， 代 码 如 下 。 


break if (i -- 70000) 


当然 ， 可 以 通过 键入 continue 69999 来 获得 相同 的 效果 ， 只 是 这 样 不 大 方便 。 

条 件 中 断 也 极其 灵活 ， 不 仅 可 以 测试 相等 或 不 相等 的 变量 。 在 condition 中 可 以 使 用 哪些 表 
XXE? 在 有 效 的 C 条 件 语 句 中 几乎 可 以 使 用 任何 表达 式 。 无 论 使 用 什么 表达 式 ， 都 需要 具有 布 
尔 值 ， 即 真 〈 非 0) 或 假 COD 。 包 丘 : 

O 相等 、 逻 辑 和 不 相等 运算 符 《<、<=、==、!=、>、>=、&&、| | 等 ) ， 例 如 : 


break 180 if string--NULL 8& i < O 






































a 按 位 和 移 位 运算 符 CR. |. ^.» <S), Bü: 
break test.c:34 if (x & y) == 1 
DQ 算术 运算 符 C+, -、X、 /、 26), 例如 : 


break myfunc if i % (j + 3) != 0 
(D 假设 声明 了 argc 和 argv 作 为 main() 的 参数 。〔 当然， 如 果 使 用 不 同 的 名 称 声 明了 它们 ， 比 如 ac 和 av， 那 么 就 使 


用 所 声明 的 名 称 。》 顺 便 提 一 下 ， 注 意 程序 总 是 人 至少 接受 一 个 参数 (通过 argv[8] 指 定 的 程序 本 里 的 名 称 ， 我 们 
这 里 没有 将 它 算 作 “ 用 户 参 数 ”) 。 
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a 你 自己 的 函数 ， 只 要 它们 被 链接 到 程序 中 ， 例 如 : 
break test.c:myfunc if ! check variable sanity(i) 
O 库 函 数 ， 只 要 该 库 被 链接 到 代码 中 ， 例 如 : 
break 44 if strlen(mystring) -- 0 


由 于 优先 级 的 次 序 规则 在 起 作用 ， 因 此 可 能 需要 使 用 圆 括 号 将 一 些 结构 括 起 来 ， 比 如 : 

















(x & y) == 0 
此 外 ， 如 采 在 GDB 表 达 式 中 使 用 库 函 数 ， 而 该 库 不 是 用 调试 从 写 编 详 的 ( 儿 乎 肯定 是 这 种 情 
况 ) ， 那 么 唯一 能 在 断 点 条 件 中 使 用 的 返回 值 类 型 为 int。 换 谨 之 ， 如 果 没 有 调试 信息 ，GDB 会 


假设 函数 的 返回 值 是 int 类 型 。 当 这 种 假设 不 正确 时 ， 孙 数 的 返回 值 会 被 曲解 。 


(gdb) print cos(0.0) 
$1 - 14368 


然而 ， 类 型 强制 转换 也 无 济 于 事 。 


(gdb) print (double) cos(0.0) 
$2 - 14336 


如 果 三 角 数 学 知识 还 没 态 的 话 ， 就 会 知道 0 的 余弦 是 1。 














使 用 非 int 返 回 函 数 
实际 上 , 有 一 种 方式 可 以 在 GDB 表 达 式 中 使 用 不 返回 int 的 函数 , 但 是 这 种 方式 相当 神秘 。 
技巧 在 于 应 使 用 指向 函数 的 恰当 数据 类 型 定义 一 个 便于 GDB 使 用 的 变量 。 
(gdb) set $p = (double (*) (double)) cos 


(gdb) ptype $p 
type = double (*)() 
(gdb) p cos(3.14159265) 


$2 - 14368 
(gdb) p $p(3.14159265) 
$4 - -1 


如 果 你 的 三 角 数 学 知识 还 有 一 点 儿 ， 就 会 知道 3.14159265 是 nt 的 近似 值 ，A 的 余弦 为 -1。 


可 以 对 正常 断后 设置 条 件 将 它们 转变 为 条 件 断 后 。 例如， 如 末 设 置 了 断 点 3 作为 无 条 件 断 点 ， 
但 是 现在 希望 添加 条 件 i==3， 只 要 键入 : 





(gdb) cond 3 i == 3 


和 如果 以 后 要 删除 条 件 ， 但 是 保持 该 断后 ， 只 要 键入 : 
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(gdb) cond 3 


2.10.2 DDD 


在 DDD 中 设置 条 件 断 点 可 以 通过 在 控制 台 窗 口中 设置 GDB 语 义 来 实现 。 或 者 按 如 下 所 示 的 方 
式 使 用 DDD。 在 代码 中 希望 出 现 条 件 断 点 的 地 方 设置 正常 断 点 〈( 即 非 条 件 断 点 )。 右 击 并 按 下 红 
色 停 止 符号 来 打开 一 个 菜单 并 选择 Properties。 这 时 会 出 现 一 个 弹出 窗口 ， 有 一 个 名 为 Condition 的 
文本 入 口 杠 。 在 该 框 中 键入 条 件 ， 单 击 Apply 按 钮 ， 然 后 蛙 击 Close 按 钮 。 断 点 现在 束 是 条 件 断 点 。 

这 一 过 程 如 图 2-16 所 示 。 我 们 在 汤 点 4 上 看 到 了 条 件 j==@8。 顺 便 说 一 下 ， 那 一 行 代码 上 的 集 
止 符号 现在 会 包含 一 个 问号 ， 提 醒 我 们 这 是 条 件 中 断 。 

















bd DDD: Properties: Breakpoint 4 





图 2-16 在 DDD 中 对 断 点 施加 条 件 


2.10.3 Eclipse 


为 了 使 断 点 成 为 条 件 断 点 , 右 击 该 行 代码 的 断 点 符号 ,选择 Breakpoint Properties... Common, 
并 在 对 话 框 中 填充 条 件 。 该 对 话 框 如 图 2-17 所 示 。 





Common 





Type: C/C++ line breakpoint 

File: /workspace/insert_sort/ins.c 
Filtering Line number: 52 

[v] Enabled 


Codi 
— 4 











图 2-17 在 Eclipse 中 对 断 点 施加 条 件 
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2.11 断 点 命令 列表 


当 GDB 遇 到 断 点 时 ， 儿 乎 总 是 要 奋 看 茶 个 变量 。 如 采 反 复 遇 到 同一 个 断 点 《与 循环 内 的 断 点 
一 样 ) ， 将 反复 但 看 相同 的 变量 。 让 GDB 在 每 次 到 达 示 个 断 氮 时 目 动 执行 一 组 命令 ， 从 而 目 动 完 
成 这 一 过 程 ， 不 是 很 好 吗 ? 

EKE, MH “Ware Wie” WR BOXES. 我们 将 使 用 GDB 的 printf 命 令 来 说 明 命 令 
列表 。 虽 然 本 书 还 没有 正式 介绍 printf， 但 是 它 在 GDB 中 的 工作 方式 与 在 C 中 基本 相同 ， 上 只 有 是 
FS we PY RELY 


fii Fl commands fis 4 V B tin vx. 


commands breakpoint-number 



































r1 
N 


commands 
end 


其 中 breaRpoint-number 是 要 将 命令 添加 到 其 上 的 断 点 的 标识 符 ，commands 是 每 行 一 个 有 效 
GDB 命 令 的 列表 。 逐 条 输入 命令 ， 然 后 键入 end 表 示 输 入 命令 完毕 。 从 那 以 后 ， 每 当 GDB 在 这 个 
断 点 处 中 断 时 ， 它 都 会 执行 你 输入 的 任何 命令 。 让 我 们 看 一 个 示例 ， 见 代码 清单 2-3。 


代码 清单 2-3 fibonacci.c 





#include «stdio.h» 
int fibonacci(int n); 


int main(void) 
{ 
printf("Fibonacci(3) is %d.\n", fibonacci(3)); 


return 0; 


} 


int fibonacci(int n) 
i 
at (nsona) 
return 1; 
else 
return fibonacci(n-1) + fibonacci(n-2); 


} 


我 们 打算 查 看 传递 给 fibonacci() 的 值 及 其 次 序 。 然 而 ， 你 不 想 在 程序 中 插入 printf() 语 句 并 
香 狐 编译 代码 。 在 关于 调试 的 书 中 这 样 做 很 共 抽 ， 是 吧 ? 更 要 命 的 是 ， 择 入 代码 并 重 狐 编 详 / 连 接 
需要 花 时 间 , 修复 了 这 个 特定 程序 错误 后 再 去 挥 该 代码 也 需要 花 时 间 , 尤其 是 当 程 序 比 较 大 时 更 是 
如 些 。 而 且 ， 与 代码 无 关 的 语句 会 使 代码 混乱 ， 因 此 这 样 使 得 在 调试 期 间 代码 难以 阅读 。 
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可 以 使 用 step 单 步调 试 代 码 ， 并 在 每 次 调用 fibonacci() 时 输出 n， 但 是 使 用 命令 列表 更 好 ， 
因为 这 样 束 不 圾 要 重复 键入 输出 命令 。 让 我 们 看 一 下 。 

站 先 ， 在 fibonacci() 最 上 方 设 置 一 个 断 点 。 这 个 断 点 将 被 指定 为 标识 符 1， 因 为 它 是 设置 的 
第 一 个 断 点 。 然 后 在 断 点 1 上 设置 一 个 输出 变量 n 的 命令 。 


$ gdb fibonacci 

(gdb) break fibonacci 

Breakpoint 1 at 0x80483e0: file fibonacci.c, line 13. 
(gdb) commands 1 


Tune cammande far whan hreab 
yr} he LCA NA O3 IL Cidg LT g] [和 

















poin 
End with a line saying just "end". 
»printf "fibonacci was passed %d.\n", n 
»end 


(gdb) 
现在 运行 程序 ， 并 查看 发 生 了 什么 事情 。 


(gdb) run 
Starting program: fibonacci 











Breakpoint 1, fibonacci (n-3) at fibonacci.c:13 
13 if (n<=0 || n--1) 
fibonacci was passed 3. 

(gdb) continue 

Continuing. 


Breakpoint 1, fibonacci (n-2) at fibonacci.c:13 
13 if (n<=0 || n==1) 
fihanarceri wac maccond 9 

LUMA WAD | wh aoa 
(gdb) continue 
Continuing. 


Breakpoint 1, fibonacci (n-1) at fibonacci. 
13 if (n«»0 || n=1) 
fibonacci was passed 1. 

(gdb) continue 

Continuing. 


e 


: 13 


Breakpoint 1, fibonacci (n=0) at fibonacci.c:13 
13 if (n<=0 || n==1) 
fibonacci was passed O. 

(gdb) continue 

Continuing. 


Breakpoint 1, fibonacci (n-1) at fibonacci.c:13 
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13 | 人 
fibonacci was passed 1. 

(gdb) continue 

Continuing. 

Fibonacci(3) is 3. 


Program exited normally. 
(gdb) 


AR WROTE, Att AUK. Hee, RANGA Seth. Brae, FAY 
使 用 silent 命 令 〈 它 需要 是 命令 列表 中 的 第 一 个 命令 ) 使 GDB 更 安静 地 触及 断 点 。 让 我 们 看 一 下 
silent 的 实际 应 用 。 注 意 我 们 如 何 通 过 将 新 命令 列表 放 在 我 们 原来 设置 的 命令 列表 “上 面 ” KE 
新 定义 命令 列表 。 


(gdb) commands 1 
Type commands for when breakpoint 1 is hit, one per line. 
End with a line saying just "end". 


POLLO 


»printf "fibonacci was passed %d.\n", n 
»end 
(gdb) 


输出 如 下 所 示 。 


(gdb) run 

Starting program: fibonacci 
fibonacci was passed 3. 
(gdb) continue 

Continuing. 

fibonacci was passed 2. 
(gdb) continue 

Continuing. 


£ihanarra LFT pe E a nacca 
i1DOndCcCi Was pd55c 


(gdb) continue 
Continuing. 

fibonacci was passed O. 
(gdb) continue 
Continuing. 

fibonacci was passed 1. 
(gdb) continue 
Continuing. 
Fibonacci(3) is 3. 


I2 


Program exited normally. 
(gdb) 
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现在 的 输出 结果 不 错 。 要 介绍 的 最 后 一 个 功能 是 : 如 果 命 令 列 表 中 的 最 后 一 个 命令 是 
continue，GDB 将 在 完成 命令 列表 中 的 命令 后 继续 目 动 执行 程序 。 


(gdb) command 1 

Type commands for when breakpoint 1 is hit, one per line. 
End with a line saying just "end". 

>silent 

»printf "fibonacci was passed %d.\n", n 

»continue 

»end 

(gdb) run 

Starting program: fibonacci 

fibonacci was passed 3. 





fibonacci was passed 2. 
fibonacci was passed 1. 
fibonacci was passed 0. 
fibonacci was passed 1. 
Fibonacci(3) is 3. 


Program exited normally. 
(gdb) 


你 可 能 要 在 其 他 程序 或 者 该 程序 的 其 他 代码 行 中 做 这 种 类 型 的 事情 ， 因 此 让 我 们 顺势 使 用 
GDB 的 define 命 令 创建 安 。 
首先 ， 让 我 们 定义 宏 ， 命 名 为 print_and_go。 


(gdb) define print and go 

Redefine command "print and go"? (y or n) y 
Type commands for definition of "print and go". 
End with a line saying just "end". 

>printf $argO, $argi 

»continue 

»end 


BEAR EIR GABE TE IAT Ze BEA: 


(gdb) commands 1 

Type commands for when breakpoint 1 is hit, one per line. 
End with a line saying just "end". 

>silent 

»print and go "fibonacci() was passed %d\n" n 

»end 


HEX, print and golf] S7 RAL S. Wea AITE, TES] DAA TRIES Ar dh 
但 是 好 处 是 现在 可 以 在 代码 中 的 任何 地 方 使 用 这 个 宏 。 MEL, AT DORA DRE. gdbinit AFP, TET 
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其 他 程序 使 用 。 顺 便 说 一 下 ， 尺 管 这 个 示例 中 只 有 2 个 参数 ， 但 最 多 允许 有 10 个 参数 。 
PEA show user 可 以 列 出 所 有 安 。 
尽管 命令 列表 非常 有 用 ， 但 是 将 它们 与 条 件 中 断 合并 后 ， 将 其 SEEN MIB e 使 用 这 种 条 件 
输入 /输出 ， 甚 至 可 以 试 着 抛 掉 C 语 言 ， 只 使 用 GDB 作 为 所 选择 的 编程 语言 。 当 然 ， 这 只 是 开 个 玩 


AY 


天 。 




















命令 与 表达 式 
实际 上 ，2.12.2 节 列 出 的 任何 有 效 GDB 表 达 式 都 可 以 进入 命令 列表 。 可 以 使 用 库 涵 数 ， 其 
至 你 自己 的 函数 ， 只 要 它们 被 连接 到 执行 文件 中 即 可 。 可 以 使 用 它们 的 返回 值 ， 只 要 它 全 
的 值 为 int 类 型 。 例 如 : 


(gdb) command 2 

Type commands for when breakpoint 2 is hit, one per line. 
End with a line saying just "end". 

»silent 

»printf "string has a length of %d\n", strlen(string) 
»end 








DDD FHS RAWSDDD PHATE. Hoc. WHA. Aare Ikea S. FP 
择 Properties。 这 时 会 出 现 一 个 弹出 窗口 。 右 边 会 有 一 个 大 的 子 窗口 〈 如 采 看 不 到 这 个 大 子 窗口 ， 
单 击 Edit 按 钮 ， 会 使 命令 窗口 出 现 ) 。 可 以 将 命令 都 键入 到 这 个 窗口 中 。 还 有 一 个 Record 按 饵 ， 
右 击 这 个 按钮 ， 可 以 将 命令 输入 GDB 控 制 台 中 。 

Eclipse 似乎 没有 命令 列表 功能 


2.12 EST ER 
监视 点 是 一 种 特殊 类 型 的 断 点 ， 它 类 似 于 正常 断 点 ， 是 要 求 GDB 和 暂停 程序 执行 的 指令 。 区 


signis 扩 没 有 “ 住 在 ”对 一 行 源 代 人 码 中 ， 而 是 指示 GDB 每 当 作 个 表达 式 改变 了 值 束 暂 集 执 
“该 表达 式 可 以 非常 简单 ， 比 如 变量 的 名 称 : 


(gdb) watch i 
已 会 使 得 每 当 i 改 变 值 时 GDB 就 叔 俘 。 表 达 式 也 可 以 非常 复杂 。 
(gdb) watch (i | j > 12) 8& i > 24 8& strlen(name) > 6 


可 以 将 监视 点 看 做 被 “附加 ”在 表达 式 上 ， 当 表达 式 的 值 改变 时 ，GDB 会 暂停 程序 的 执行 。 
虽然 党 理 监 视点 和 断 点 的 方式 相同 ,但 是 两 者 之 间 有 一 个 重要 区 别 。 断 操 与 源 代 人 码 中 的 一 个 
位 置 关 联 。 只 要 代码 没有 改变 ， 吏 不 存在 茶 行 代码 “超出 作用 域 ” 的 风险 。 因 为 C 语 言 有 严格 的 









































CD 表达 式 将 在 2.12.2 节 中 更 全 面 地 介绍 。 
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作用 域 规则 , 所 以 只 能 监视 存在 且 在 作用 域内 的 和 变量, 一旦 变量 不 再 存在 于 调用 栈 的 任何 帧 中 ( 当 
包含 局 部 变量 的 函数 返回 时 )，GDB 会 自动 删除 监视 点 。 

例如 2.5 贡 中 名 为 swapper 的 程序 。 在 这 个 程序 中 ， 将 局 部 变量 c 用 于 临时 存储 器 。 在 GDB 到 
达 定 义 了 c 的 swapperc 的 第 3 行 乙 本 ， 不 能 在 c 上 设置 监视 点 。 上 此外， 如果 在 c 上 设置 了 监视 点 ， 一 
旦 GDB 从 swapper() 返 回 ， 就 会 自动 删除 该 监视 点 ， 因 为 c 不 复 存在 。 

每 次 变量 改变 时 都 让 GDB 中 断 ， 对 于 被 循环 紧密 包 囊 的 代码 或 者 重复 代码 来 说 可 能 有 点 讨 
大 。 虽然 监视 点 昕 上 去 不 错 , 但 是 位 置 选 得 好 的 断 点 可 能 要 有 用 得 多 。 然 而 ， 如 果 你 的 一 个 变量 
修改 了 ， 特 别 是 全 局 变量 ， 而 你 义 不 知 道 它 是 在 哪里 为 什么 发 生 了 改变 ， 则 监视 点 束 是 无 价 的 。 
如 果 你 在 处 理 线程 代码 ， 监 视点 的 用 处 就 有 限 GDB 只 能 监视 单个 线程 中 的 变量 。 第 5 章 对 此 会 


进一步 介绍 。 
2.12.1 设置 监视 点 
当 变 量 var 存 在 且 在 作用 域 中 时 ， 可 以 通过 使 用 如 下 命令 来 设置 监视 点 。 





















































watch var 


该 命令 会 导致 每 当 var 改 变 值 时 GDB 都 中 断 。 很 多 人 因此 而 喜欢 监视 点 ， 党 得 它 简 单方 便 。 然 而 ， 
还 有 一 蔡 情况 要 说 明 。GDB 实 际 上 有 是 在 var 的 内 存 位 置 改 变 值 时 中 断 。 一 般 情 况 下 ， 是 合 使 用 监 
视点 监视 变量 或 变量 的 地 址 并 没有 关系 , 但 是 在 特殊 情况 下 这 一 点 可 能 很 重要 ， 比 如 当 人 处 理 指 问 
站 针 的 指针 时 。 

















硬件 监视 点 
当 设 置 监 视点 时 ， 可 以 看 到 一 条 关于 “硬件 ”监视 点 的 消息 : 


(gdb) watch i 
Hardware watchpoint 2: i 


列 出 断 点 时 ， 同 样 也 能 看 到 类 似 的 消息 : 


(gdb) info breakpoints 
Num Type Disp Enb Address What 
2 hw watchpoint keep y i 


显然 ，2 是 指 监视 点 标识 符 ，i 是 指 被 监视 的 变量 ， 但 是 “硬件 ”监视 点 是 指 什么 呢 ? 

很 多 平台 都 有 实现 监视 点 的 专用 硬件 。 如 果 有 这 样 的 硬件 可 用 ，GDB 会 党 试 使 用 该 硬件 ， 
因为 使 用 硬件 实现 任何 操作 都 比较 快 。 

GDB 可 能 无 法 设置 硬件 监视 点 (该 平台 可 能 没有 必需 的 硬件 , 或 者 硬件 正 忙 于 别 的 事情 )。 
如 果 是 这 样 ，GDB 会 尝试 使 用 虚拟 内 存 技术 实现 监视 点 ， 这 也 很 快 。 

如 果 这 两 种 技术 都 不 可 用 ，GDB 会 通过 软件 实现 监视 点 本 身 ， 这 会 非常 非常 慢 。 

CPU 只 能 实现 有 限 数量 的 硬件 辅助 中 断 ， 包 括 监视 点 和 硬件 辅助 断 点 。 虽 然 这 个 数量 与 架 
构 有 关 ， 但 是 如 果 超 出 了 这 个 限制 ，GDB 就 会 输出 如 下 消息 。 
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Stopped; cannot insert breakpoints. 
You may have requested too many hardware breakpoints and watchpoints. 


如 果 看 到 这 条 消息 ， 就 应 该 删除 或 系 用 部 分 监视 点 或 硬件 辅助 断 点 。 








让 我 们 看 一 个 监视 点 非 第 有 用 的 示例 场景 。 假 设 有 两 个 int 变 量 x 和 y， 在 代码 中 的 人 条 一 处 执 
行 p=&y， 而 你 的 意 网 是 执行 p=&x。 这 可 能 会 导致 y 在 代码 中 共处 神秘 地 改变 了 值 。 导 致 程序 错误 
的 实际 位 置 可 能 隐 韦 得 很 好 ， 因 此 断 点 的 用 处 不 会 太 大 。 然 而 ， 通 过 设置 监视 点 ， 可 以 立刻 知道 
y 在 何 时 何 处 值 发 生 了 变化 。 

监视 点 的 好 处 甚至 还 不 止 这些 , 它 不 仅仅 限于 监视 变量 。 事 实 上 , 还 可 以 监视 变量 的 表达 式 。 
每 当 表 达 式 修改 值 时 ，GDB 都 会 中 断 。 作 为 一 个 示例 ， 来 看 如 下 代码 。 

















1 #include <stdio.h> 
2 int i = 0; 


4 int main(void) 


» 1 

6 i= 3; 

f | L to Olle MI } Tj 
8 

9 1=5; 


10 printf("i is %d.\n", i); 

12 return 0; 

is} 

我 们 想 在 每 当 i 大 于 4 时 得 到 通知 。 因 此 在 main() 的 入 口 处 放 一 个 断 点 ， 以 便 让 i 在 作用 域 中 ， 
并 设置 一 个 监视 点 以 指出 i 何 时 大 于 4。 不 能 在 i 上 设置 监视 点 ， 因 为 在 程序 运行 之 前 ，i 不 存在 。 
因此 必须 先 在 main() 上 设置 断 点 ， 然后 在 i 上 设置 监视 点 。 














(gdb) break main 

Breakpoint 1 at 0x80483b4: file test2.c, line 6. 
(gdb) run 

Starting program: test2 


Breakpoint 1, main () at test2.c:6 








既然 i 已 经 在 作用 域 中 了 ， 现 在 设置 监视 点 并 通知 GDB 继 续 执行 程序 。 我 们 完全 可 以 料 到 ， 
在 第 9 行 时 会 出 现 i>4 的 情况 。 


1 (gdb) watch i > 4 

» Hardware watchpoint 2: i» 4 
(gdb) continue 

4 Continuing. 
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Hardware watchpoint 2: i» 4 
Old value - O 


s New value = 1 
» main () at test2.c:10 





RE, GDBfESSO94TAUSIOTTZLIRIEIER f, ERKAN DAKE Ch) eA fai CA). 

可 以 使 用 这 种 方法 在 控制 台 窗 口中 设置 监视 点 ， 然 而 ， 你 可 能 发 现 使 用 GUI 接口 更 方便 。 在 
源 窗口 中 ,找到 要 在 其 上 设置 监视 点 的 变量 。 这 个 位 置 不 必 是 变量 第 一 次 出 现 的 地 方 ， 可 以 是 它 
在 源 代码 中 出 现 的 任 一 处 。 单 击 该 变量 以 突出 显示 它 ， 然 后 单 击 采 蛙 栏 图 标 中 的 监视 点 特写。 监 
视点 的 设置 不 会 有 像 断 点 的 红色 停止 从 号 那样 的 标记 。 为 了 但 看 设置 的 监视 点 ， 必 须 按 2.3.2 节 介 
绍 的 方法 实际 列 出 所 有 汤 点 。 

在 Eclipse 中 设置 监视 点 的 方法 如 下 : 在 源 代码 窗口 中 右 击 ， 选 择 Add a Watch Expression, 2^ 
后 在 对 话 框 中 填写 所 需 表 达 式 。 


2.12.2 ”表达 式 


前 面 我 们 介绍 了 通过 GDB 的 watch 命 令 使 用 表达 式 (expression〉 的 一 个 示例 。 该 示例 表明 ， 
有 相当 多 的 GDB 命 令 〈 比 如 print) 也 接受 表达 式 参 数 。 因 此 ， 我 们 也 许 应 当 对 它们 多 进行 一 点 
儿 介绍 。 

GDB 中 的 表达 式 可 以 包含 很 多 内 容 : 

口 便于 GDB 使 用 的 变量 ; 

a 程序 中 的 任何 在 作用 域内 的 变量 ， 比 如 前 面 的 示例 中 的 i; 

a 任何 种 类 的 字符 串 、 数 值 或 学 从 沼 量 ; 

D 预 处 理 器 宏 〈( 如 果 程 序 被 编译 为 包括 预 处 理 器 调试 信息 ); 

a 条件、 函数 调用 、 类 型 强制 转换 和 上 所 用 语言 定义 的 运算 符 。 

因此 ， 如 果 在 调试 FORTRAN-77 程 序 ， 并 且 想 知道 变量 i 何 时 变 得 大 于 4， 不 需要 像 上 一 节 中 
那样 使 用 watch i>4， 而 是 可 以 使 用 watch i .GT. 4. 

虽然 在 很 多 教程 和 文档 中 常 将 C 语 法 用 于 GDB 表 达 式 ， 但 那 是 由 于 C 和 C++ 的 普遍 存在 的 性 
质 ; 如 果 使 用 的 是 C 语 言 以 外 的 语言 ，GDB 表 达 式 就 得 用 该 语言 的 元 素 中 构建 。 




































































CD 在 编写 本 书 时 ，GNU GDB 官 方 使 用 手册 指出 预 处 理 器 宏 不 能 用 在 表达 式 中 ， 然 而 情况 并 非 如 此 。 如 果 使 用 GCC 
的 -g3 选 项 编译 ， 丈 能 在 表达 式 中 使 用 预 处 理 占 宏 。 
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p: 








Pree 1 章 介 绍 过 ， 在 GDB 中 可 以 使 用 print 命 令 输出 变量 的 值 ， 在 DDD 和 Eclipse 中 可 以 通过 
Lr 将 鼠标 指针 移 到 源 代 码 中 任何 地 方 的 变量 的 实例 上 来 输出 变量 的 值 。 但 是 GDB 和 GUI 
者 提供 了 更 强大 的 检查 变量 和 数据 结构 的 方法 ， 这 是 本 章 将 重点 介绍 的 内 容 。 


3.1 主要 示例 代码 
F 面 是 二 又 树 的 一 种 直观 实现 (还 没有 顾及 到 效率 、 模 块 化 等 )。 


// bintree.c: routines to do insert and sorted print of a binary tree 




















#include <stdio.h> 


#include <stdlib.h> 
struct node { 


int val; // stored value 

struct node «left; // ptr to smaller child 

struct node «right; // ptr to larger child 
n 


typedef struct node nsp; 
nsp root; 


nsp makenode(int x) 


{ 
nsp tmp; 
tmp = (nsp) malloc(sizeof(struct node)); 
tmp->val = x; 
tmp->left = tmp->right = 0; 
return tmp; 
} 


void insert(nsp *btp, int x) 
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| 
nsp tmp = xbtp; 
if (wbtp == 0) { 
xbtp = makenode(x); 
return; 
} 
while (1) 
{ 
if (x < tmp->val) { 
if (tmp->left != 0) { 
tmp = tmp->left; 
} else { 
tmp-»left = makenode(x); 
break; 
J 
} else 1 
if (tmp-»right !- 0) ( 
tmp - tmp-»right; 
} else { 
tmp->right = makenode(x); 
break; 
} 
} 
} 
} 
void printtree(nsp bt) 
{ 
if (bt == 0) return; 
printtree(bt-»left); 
printf("%d\n" ,bt-»val); 
printtree(bt-»right); 
j 


int main(int argc, char xargv[]) 
t inti; 


root = 0; 
for (i = 1; i < argc; i++) 
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insert(&root, atoi(argv[i])); 
printtree(root); 


j 


在 各 个 节点 上 ,， 左 子 树 的 所 有 元 素 都 小 于 给 定 节 点 中 的 值 ， 右 子 树 的 所 有 元 素 者 大 于 等 于 给 
定 市 点 中 的 值 。 函数 insert() 创 建 了 一 个 新 市 点 , 并 将 它 放 在 树 中 恰当 的 位 置 。 函数 printtree() 
按 数 字 升 序 显示 任意 子 树 的 元 素 ， 而 main() 运 行 一 个 测试 ， 输 出 整个 排序 后 的 数组 。™ 

对 于 这 里 的 调试 示例 , 假设 不 小 心 在 insert() 中 把 对 makenode() 进 行 第 二 次 调用 的 代码 错 写 
成 : 

tmp-»left = makenode(x); 
而 不 是 

tmp-»right = makenode(x); 
WRIST RR i Ye VEMM. S Eu «n. 


$ bintree 12 8 5 19 16 
16 
12 


让 我 们 探索 一 下 调试 工具 中 的 各 种 检查 命令 如 何 帮 助 尽快 找到 程序 错误 。 
3.2 ”变量 的 高 级 检查 和 设置 

我 们 这 里 的 树 示例 复杂 性 更 高 ， 因 此 需要 更 高 级 的 方法 。 下 面 将 介绍 部 分 方法 。 
3.2.1 在 GDB 中 检查 


在 以 前 的 章节 中 使 用 过 GDB 的 基本 print 命 令 。 在 这 里 如 何 使 用 它 呢 ? 主要 工作 显然 是 在 
insert() 中 完成 ,因此 该 方法 将 是 一 个 好 的 起 始 反 。 当 仍然 在 该 函数 的 while 循 环 中 运行 GDB 时 ， 
可 以 在 每 次 过 到 断 点 时 执行 一 组 (3 个 ) GDB 命 令 。 





















































(gdb) p tmp->val 

$1 - 12 

(gdb) p tmp-»left 

$2 = (struct node *) 0x8049698 
(gdb) p tmp->right 

$3 = (struct node *) 0x0 


EBRIETA, GDB MPI A$1. $255, HEB BASLER LAR RATE.. 
市 进一步 讨论 它们 。) 
在 这 里 将 发 现 ，tmp 当 前 指 问 的 节点 包含 12， 有 一 个 非 0 左 指针 ， 而 不 是 为 0 的 右 指 针 。 当 然 ， 











CD 顺便 说 一 下 , 注意 第 12 行 中 的 类 型 定义 nsp。 这 代表 node struct pointer, 但 是 我 们 的 出 版 商 认 为 它 是 No Starch Press. 
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左 指 针 的 实际 值 ， 即 实际 内 存 地 址 ， 可 能 与 这 里 介绍 的 内 容 没 有 直接 关系 ， 但 是 指针 是 否 为 0 这 
一 事实 是 重要 的 。 关 键 是 这 里 目前 看 到 的 是 低 于 12 的 左 子 树 ， 而 不 是 右 子 树 。 

@ 第 一 个 改进 : 输出 完整 的 结构 

每 次 到 达 一 个 断 点 时 都 要 键入 这 3 个 print 命 令 会 非常 费力 。 我 们 可 以 只 用 一 个 print 命 令 来 
完成 ， 用 法 如 下 。 


(gdb) p «tmp 
$4 = {val = 12, left = 0x8049698, right = 0x0} 


由 于 tmp 指 问 该 结构 ， 因 此 *tmp 是 这 个 结构 本 喘 ，GDB 癌 我 们 显示 了 完整 的 内 容 。 

@ 第 二 个 改进 : 使 用 GDB 的 display 命 令 

键入 上 面 的 p *tmp 能 节省 时 间 和 精力 。 每 次 遇 到 断 点 时 ， 只 需要 键入 一 个 GDB 命 令 ， 而 不 是 
3 个 。 但 是 ， 如 果 知 道 会 在 每 次 过 到 汤 点 时 都 键入 这 个 命令 ， 那么 使 用 GDB 的 display 命 令 ( 人 简写 
ee JJ. XX fi BER GDBTEBUT PRK AS CTA, 使 用 next 
或 step 命 令 等 ) 时 束 输 出 指定 条 目 

(gdb) disp *tmp 

1: «tmp = {val = 12, left = 0x8049698, right = 0x0} 


(gdb) c 
Continuing. 

















Breakpoint 1, insert (btp=0x804967c, x=5) at bintree.c:37 
37 if (x « tmp-»val) { 
1: «tmp = {val = 8, left = 0x0, right = 0x0} 


正如 在 这 里 所 见 的 ，GDB 在 遇 到 断 点 以 后 目 动 得 出 *tmp， 因 为 执行 了 display 命 令 。 

当然 ， 只 有 当 变 量 在 作用 域 中 时 ， 才 会 将 显示 列表 中 的 变量 显示 出 来 。 

e 第 三 个 改进 : 使 用 GDB 的 commands 命 令 

假设 希望 在 给 定 节 点 上 时 得 看 子 季 点 的 值 。 第 1 章 介 绍 过 GDB 的 commands 命 令 ， 可 以 按 如 下 
代码 使 用 。 


(gdb) b 37 
Breakpoint 1 at 0x8048403: file bintree.c, line 37. 
(gdb) commands 1 
Type commands for when breakpoint 1 is hit, one per line. 
End with a line saying just "end". 
»p tmp-»val 
»if (tmp-»left !- 0) 
>p tmp-»left-»val 
»else 
»printf "sWn", "none" 
»end 





























Ret KSA cindy282694 SS 尊重 版 权 





82 第 3 章 检查 和 设置 变量 


»if (tmp-»right != 0) 
»p tmp-»right-»val 
»else 
»printf "sWn", "none" 
»end 

»end 


注意 ， 在 这 个 示例 中 ，GDB 的 print 命 令 有 一 个 更 强大 的 相关 命令 
与 C 语 言 同名 命令 相似 。 
下 面 是 得 到 的 GDB 会 话 的 采样 。 


Breakpoint 1, insert (btp-0x804967c, x-8) at bintree.c:37 
37 if (x « tmp-»val) 

$7 = 12 

none 

none 

(gdb) c 

Continuing. 














printf()， 它 的 格式 








Breakpoint 1, insert (btp-0x804967c, x=5) at bintree.c:37 
37 if (x « tmp-»val) 

$6 = 12 

$7 = 8 

none 

(gdb) c 

Continuing. 


Breakpoint 1, insert (btp=0x804967c, x=5) at bintree.c:37 
37 if (x < tmp-»val) 

$8 = 8 

none 

none 


当然 ， 使 用 标签 等 可 以 使 输出 更 易 读 。 

e 第 四 个 改进 : 使 用 GDB 的 call 命 令 

调试 中 的 一 个 常见 方法 是 隔离 出 现 问题 的 此 一 个 数据 项 。 在 这 个 例子 中 ,可 以 通过 在 每 次 完 
成 对 insert() 的 调用 时 输出 整个 树 来 完成 这 件 事 。 由 于 无 论 如 何 源 文件 中 都 有 一 个 函数 一 一 
printtree() 可 以 做 这 件 事 ， 因 此 可 以 简单 地 在 源 代 人 码 中 调用 insert() 之 后 马上 增加 对 这 个 函数 
的 调用 。 

for (i = 1; i « argc; i++) { 


insert (&root, atoi(argv[i])); 
printtree(root); 











i 
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然而 ， 从 各 种 角度 来 看 这 样 可 能 不 理想 。 比 如 ， 这 可 能 意味 着 必须 花 时 间 来 编辑 源 代 码 文 件 
并 重新 编译 。 前 者 会 分 散 注 意 力 ， 后 者 在 程序 比较 大 的 情况 下 比较 费时 间 。 毕 葛 ， 这 是 试图 通过 
使 用 调试 器 避免 的 事情 。 

相反 ， 从 GDB 中 做 这 件 事 就 比较 好 。 可 以 通过 GDB 的 cal1 命 令 做 这 件 事 。 例 如 ， 可 以 在 第 
S$7 行 〈 即 insert() 的 末尾 ) 设置 一 个 断 点 ， 然 后 执行 如 下 代码 。 


(gdb) commands 2 

Type commands for when breakpoint 1 is hit, one per line. 
End with a line saying just "end". 

>print 征 “六 六 六 六 六 站 六 站 六 站 六 Current tree 六 六 六 六 六 六 六 六 站 六 站 

»call printtree(root) 

»end 


f SII GDBZ Hr P: 


Breakpoint 2, insert (btp-0x8049688, x-12) at bintree.c:57 
57 } 

Xobkxexekeke current tree 玉米 炒米 炒米 炒米 

12 

(gdb) c 

Continuing. 





Breakpoint 2, insert (btp=0x8049688, x-8) at bintree.c:57 
57 } 

foo current tree kk 

8 

12 

(gdb) c 

Continuing. 


Breakpoint 2, insert (btp-0x8049688, x-5) at bintree.c:57 
57 } 

ooo current tree 六 六 六 六 六 六 六 六 六 六 六 

5 

8 

12 

(gdb) c 


Continuing. 


Breakpoint 2, insert (btp=0x8049688, x=19) at bintree.c:57 
57 | 

coo: current tree 六 六 六 六 六 六 六 六 站 六 站 

19 

12 
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注意 ， 这 一 结果 表示 引起 问题 的 第 一 个 数据 项 是 19。 有 了 这 一 信息 可 以 很 快 直 接 瞄 准 程序 
彰 误 。 使 用 同样 的 数据 重新 运行 程序 ， 在 insert() 的 开头 设置 一 个 断 点 ,但 是 这 次 使 用 条 件 x == 


19， 然 后 研究 那里 发 生 了 什么 事情 。 





可 以 动态 地 修改 给 定 断 点 的 命令 集 ， 或 者 傈 单 地 通过 重新 定义 一 个 空 集合 来 取消 该 命令 集 。 


(gdb) commands 1 


Type commands for when breakpoint 1 is hit, one per line. 


End with a line saying just "end". 
»end 


3.22 ”在 DDD 中 检查 


现在 你 已 经 知道 ， 可 以 从 DDD 的 DDD 探 制 台 窗口 中 调用 任何 GDB 命 令 。 但 是 DDD 的 一 个 真 
正 的 优点 是 在 DDD 中 运行 很 多 GDB 命 令 更 方便 ， 在 有 些 情况 下 ，DDD 人 能够 执行 GDB 无 法 提供 的 
强 有 力 的 操作 ， 比 如 显示 下 面 描述 的 链接 数据 结构 。 

正如 前 面 儿 章 所 提 到 的 , 在 DDD 中 检查 变量 的 值 是 非常 方便 的 : 只 要 将 鼠标 指针 移 到 源 代码 
窗口 中 变量 的 任何 实例 上 。 但 是 还 有 其 他 很 多 方法 也 值得 使 用 ,尤其 是 对 于 使 用 链接 数据 结构 的 
程序 。 我 们 将 通过 使 用 本 章 前 面 的 二 又 树 示 例 来 说 明 。 














前 面 介 绍 过 GDB 的 display 命 令 : 
(gdb) disp *tmp 


这 里 , tmp 指 问 结构 的 内 容 在 每 次 过 
到 汤 点 时 目 动 输出 ， 否 则 会 导致 暂 停 执 
行程 序 。 由 于 tmp 是 指 癌 这 标 树 中 当前 节 
点 的 指针 ， 因 此 这 种 目 动 输出 有 助 于 监 
视 人 吉 历 这 标 树 时 的 进度 。 

DDD 中 对 应 的 功能 是 Display 命 令 。 
如 果 在 源 代 码 窗 口中 右 击 变量 的 任 一 实 
例 ， 比 如 本 例 中 的 root， 则 会 弹出 一 个 
图 3-1 所 示 的 菜单 。 可 以 看 到 ， 该 菜单 中 
有 一 些 关 于 查看 root 的 选项 。 选 项 Print 
root 和 Print *root 的 工作 方式 与 它们 的 
GDB 对 应 命令 完全 相同 ， 事 实 上 它们 的 
输出 出 现在 DDD 的 控制 台中 在 这 里 回 
显 / 输 入 GDB 命 令 )。 但 是 对 于 目前 的 情 
况 ， 最 有 趣 的 选项 是 Displaykroot 。 遇 
到 源 代 码 的 第 48 行 的 断 点 后 ， 选 择 该 选 
项 的 结果 如 网 3-2 所 示 。 



































DDD: Jhome/nm/Debug/Boolgbintree. C 


} else { 
if (tmp-»right != 0) { 
tmp = —>right; 
} else { 
tmp-»right = makenode(x); 
break; 


void printtree(nsp bt) 


if (bt == 0) return; 
printtree(bt-»left); 
printf("%d\n",bt-—>val); 
printtree(bt-»right); 


int main(int argc, char *argv[]) 
E EnG y 


Ot argc; i++) 
t, atoicargv[i])); 
Dis 


19 16 i 
then: ES Sinot found. 
R Mert (btp=0x804972c, x=12) at bintree.c:57 


E 


图 3-1 ”查看 变量 的 弹出 窗口 
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DDD; Jhome;nmjDebug/Bookjbintree:c 


) else { 


if (tmp-»right != 0) { 
tmp = tmp-»right;i 
} else { 
tmp—>right = makenode(x); 
break; 





void printtree(nsp bt) 


if (bt == 0) return; 
printtree(bt-»left); 
printfc"%d\n" ,bt->val); 
printtree(bt-»right); 





Breakpoint 1, insert (btp=0x804972c, x-12) at bintree.c:57 
(gdb) cont 


Breakpoint 1, insert (btp=0x804972c, x=8) at bintree.c:57 
(gdb) 











图 3-2 WS AES 


这 时 出 现 一 个 新 的 DDD 窗 口 一 一 数据 窗口 ， 其 中 的 节点 对 应 于 root。 到 目前 为 止 ， 这 个 命令 
无 非 只 是 像 图 形 化 的 GDB 的 display 命 令 。 但 是 这 里 真正 的 好 处 是 可 以 跟踪 树 链接 。 比 如 ， 要 跟 
踩 树 的 左 分 文 ， 只 要 右 击 显示 的 根 节 点 的 left 学 段 。( 这 时 不 要 对 right 玫 点 这 样 做 ， 因 为 链接 为 
0.0 然后 在 弹出 菜单 中 选择 Display *() 选 项 ， 现 在 DDD 如 图 3-3 所 示 。 因 此 ，DDD 呈 现 了 这 棵 树 
(或 者 树 的 一 部 分 ) 的 图 ， 束 像 在 黑板 上 男 出 来 的 一 样 ， 非 常 酪 ! 


DDD: /home;nm/Debug/Bookj7bintree:c 








root->left->left] 


} else { 


if (tmp-»right != 0) { 
tmp = tmp-»right; 

) else { 
tmp-»right = makenode(x) ; 
break; 


void printtree(nsp bt) 


TEC t—=:0) return; 
printtree(bt-»left); 
printfc"%d\n" ,bt->val); 
printtree(bt->right); 


(gdb) cont 


Breakpoint 1, insert (btp=0x804972c, x=8) at bintree.c:57 
(gdb) graph display *(root-»left) dependent on 1 
(gdb) 











Kl3-3 ”跟踪 链接 
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每 当 市 皮 内 容 改 变 时 ， 现 有 市 点 内 容 的 显示 会 目 动 更 狐 。 每 次 一 个 链接 从 0 改变 为 非 0O 时 ， 都 
可 以 右 击 它 以 显示 新 市 反 。 

显然 ,数据 窗口 很 快 会 变 得 混乱 。 你 可 以 通过 单 击 并 拖 动 该 窗口 右 下 方 的 小 方 框 来 展开 窗口 ， 
但 是 更 好 的 方法 是 在 局 动 DDD 前 惑 预 抑 到 这 种 情况 。 如 朱 用 separate 命 令 行 选项 调用 DDD: 























$ ddd --separate bintree 


那么 会 出 现 一 些 单 独 的 窗口 一 一 源 代 人 码 窗 口 、 控 制 台 窗口 和 数据 窗口 ， 这 些 窗口 的 大 小 都 可 以 重 
新 调整 。 

如 果 要 在 DDD 会 话 期 间 删 除数 据 窗口 的 部 分 或 全 部 内 容 , 有 很 多 方式 可 以 做 到 这 一 点 。 例 如 ， 
可 以 右 击 一 个 条 目 ， 然 后 选择 Undisplay 选 项 。 
3.2.3 ”在 Eclipse 中 检查 

与 DDD 一 样 ,要 在 Eclipse 中 检查 标 量变 量 ， 只 要 将 鼠标 指针 移 到 源 代 码 窗口 中 的 变量 的 任何 
实例 上 即 可 。 注 意 ， 这 必须 是 一 个 独立 的 标量 ， 而 不 是 在 struct 中 这 样 ， 如 图 3-4 中 所 示 。 这 里 
我 们 成 功 地 查询 了 x 的 值 , 但 要 是 将 鼠标 指针 指 问 同一 行 中 tmp->val 的 val 部 分 ， 就 不 会 显示 那里 
ATA. 























3 Debug - bintree/bintree.c - Eclipse Platform mala- alea) 
Eile Edit Refactor Navigate Search Run Project Window Help 


ri $|*-0-q- | |2 9- € er or ti [fossa] crc 
































ee Breakpoints [09= Variables $2 \ fif Registers, mA Modules. xil 
A $ o» B 2$. - E “ae ¥ k 7 
wv 回 bintree Debug [C/C++ Local Application] l | Name Value 
"v QË gdb/mi (12/17/07 11:04 AM) (Suspended) D btp 0x08049728 
"7 g® Thread [0] (Suspended: Breakpoint hit.) ox 8 
= 2 insert() Wvorkspace/bintree/bintree.c:39 0x08048447 b »> tmp 0x090a9008 
=} 1 main() workspace/bintree/bintree.c:76 0x08048531 
pl gdb (12/17/07 11:04 AM) E 
| («dl 
[À bintree.c $3 呈 日 (az Outline "m \ 25 
e, 
8B . V 
while (1) A ww 
{ 则 stdio.h 
if (x < tmp->val) { EJ stdlib.h 
if (tmp-»left != 0) { Fe m 
tmp = tmp-»left; e wwe 
) else ( 6 root: nsp 


tmp-»left - makenode(x); © makenode(int) : nsp 
break; 
€ insert(nsp*, int) : void 





) 


© printtree(nsp) : void 








&  main(int char?) -int 
EJ Console 2N V Tasks | El Problems| 0 Memory. B X %|& 858 HI m E rj ^O 
bintree Debug [C/C++ Local Application] gdb (12/17/07 11:04 AM) 
No symbol "new" in current context. | 














Stopped due to shared library event 
Stopped due to shared library event 
No symbol "val" in current context. 














| 7 | 
图 3-4 在 Eclipse 中 检查 标量 变量 
这 时 ， 可 以 使 用 Eclipse 的 Variables 视 图 ， 在 图 3-5 所 示 界 面 的 右上 方 可 以 看 到 。 单 击 tmp 劳 边 
的 三 角形 来 将 它 同 下 指 ， 然 后 回 下 滚动 一 行 ， 这 时 将 发 现 显 示 了 tmp->val。( 显 示 为 包含 12 )。 
继续 进行 这 一 过 程 。 当 单 击 了 1left 劳 边 的 三 角形 以 后 ， 将 看 到 网 3-6 中 显示 的 屏幕 ， 在 其 中 
可 以 看 到 tmp->left->val 为 8。 
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|r à @| B | %- O- Q- | je- 


ji" Oe c 


v [c]bintree Debug [C/C++ Local Application] 
v. QÈ adb/mi (12/17/07 11:04 AM) (Suspended) 
Y gf Thread [0] (Suspended: Breakpoint hit.) 
= 2 insert() /workspace/bintree/bintree.c 39 0x08048447 
三 1 main() Wworkspace/bintree/bintree.c:76 0x08048531 
pi gdb (12/17/07 11:04 AM) 





{ 
«df (x < tmp->val) ( 


if (tmp->left != 0) { 
tmp = tmp->left; 
) else ( 
tmp-»left - makenode(x); 





"val" in current context. 
"val" in current context. 
"val" in current context. 
"val" in current context. 


图 3-5 


Debug - bintree/b 


Ele Edit Refactor Navigate Search Run Project Window Help 


intree.c - Eclipse Platform 








QD nsp: struct node* 


root: nsp 

makenode(int) : nsp 
insert(nsp*, int) : void 
printtree(nsp) : void 
main(int cha E int 


Eclipse tr struct AY 





| E èla | HO Ay |e | Br Gir eT & 


Renown enx|2 ee 3|H & 





v [E]bintree Debug [C/C++ Local Application] 
Y QÈ gdb/mi (12/17/07 11:04 AM) (Suspended) 
V gf Thread [0] (Suspended: Breakpoint hit.) 
= 2 insert() /workspace/bintree/bintree.c 39 0x08048447 
三 1 main() jworkspacejbintree/bintree.c:76 0x08048531 
pi gdb (12/17/07 11:04 AM) 








if (tmp->left != 0) { 
tmp = tmp->left; 

} else { 
tmp->left = makenode(x); 
break; 


= stdio.h 
"JU stdlib.h 
b © node 
GP nsp: struct node* 


root: nsp 
makenode(int) : nsp 
insert(nsp*, int) : void 
printtree(nsp) : void 


main(int char*fIl -int 


em + a- ri- =a 





图 3-6 


默认 情况 下 ，Variables 视 图 不 显 


在 Eclipse 中 跟踪 
KEHEE. 














St eee 
在 这 里 的 程序 中 ， 有 一 个 变量 root。 可 以 将 该 
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变量 添加 到 Variables 视 图 中 : 在 该 视图 中 右 击 ， 选 择 Add Global Variables， 在 出 现 的 弹出 式 窗口 


中 检 奉 root 的 框 ， 然 后 单 击 OK 鬼 钮 。 
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3.2.4 ”检查 动态 数组 
正如 第 1 章 所 讨论 的 ， 在 GDB 中 ， 可 以 输出 整个 数组 ， 比 如 对 于 如 下 数组 : 
nx 
方法 是 通过 键入 : 
pr 
但 是 ， 如 有 是 动态 创建 的 数组 会 是 什么 样 呢 ? 比如 : 


int xx; 











x = (int *) malloc(25xsizeof(int)); 


如 果 要 在 GDB 中 输出 数组 ， 束 不 能 键入 : 


6 psbsccceum 
这 个 命令 只 可 以 简单 打印 数组 地 址 。 也 不 能 键入 : 
(gdb) pax 





这 样 只 会 输出 数组 的 一 个 元 素 x[8]。 仍 然 可 以 像 在 命令 p x[5] 中 那样 输出 单个 元 票 ， 但 是 不 
能 简单 地 在 x 上 使 用 print 命 令 和 输出 整个 数组 。 

1. GDB 中 的 解决 方案 

在 GDB 中 ， 可 以 通过 创建 一 个 人 工 数组 (artificial array) 来 解决 这 个 问题 。 来 看 如 下 代码 。 


1 dnt xx; 
3  main() 
a 1 
3 x = (int *) malloc(25*sizeof(int)); 
G x[3] = 12; 
A 省 兴业 汪汪 业 天 于 和 各 汪 汪汪 汪汪 汪汪 汪汪 汪汪 汪汪 汪汪 汪汪 汪汪 汪汪 汪汪 汪汪 汪汪 汪汪 汪汪 汪汪 汪汪 汪汪 汪汪 汪 于 
然后 可 以 如 下 执行 : 
6 x = (int *) malloc(25*sizeof(int)); 
(gdb) n 
7 x[3] = 12; 
(gdb) n 
8 } 


(gdb) p *x@25 
$1 = (0, 0, O, 12, 0 «repeats 21 times>} 


可 以 看 到 ， 一 般 形 式 为 : 
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*pointerGQnumber of elements 
GDB 还 允许 在 适当 的 时 候 使 用 类 型 强制 转换 ， 比 如 : 


(gdb) p (int [25]) *x 
$2 = (0, 0, 0, 12, 0 «repeats 21 times>} 


2. DDD 中 的 解决 方案 

与 惯 币 一 样 ， 可 以 利用 GDB 方 法 ， 本 和 中 是 通过 DDD 探 制 台 使 用 人 工 数组 。 
另 一 个 选项 是 输出 或 显示 内 存 的 苑 围 〈 参 见 3.2.7 节 )。 

3. Eclipse 中 的 解决 方案 

这 里 可 以 使 用 Eclipse 的 Display As Array 命 令 。 

例如 ， 证 我 们 稍微 扩展 一 下 前 面 的 示例 。 

















1 Int xx; 

3 main() 

pod 

5 int y; 

6 x = (int *) malloc(25xsizeof(int)); 
7 scant ("%d%d" ,&x[3],&x[8]); 

8 y = x[3] + x[8]; 

9 printf("%d\n",y); 

wo } 





[Bou H B TEZRyW HR. HIMA t Variable KHA ERER EZM. AAE 
Variables 视 图 中 右 击 x， 并 选择 Display As Array。 在 得 到 的 弹出 框 中 ， 填 充 Start Index#lLength# 
段 ， 比 如 分 别 填写 为 0 和 25 来 显示 整个 数组 。 屏 做 现在 如 图 3-7 所 示 。 可 以 看 到 Variable 视 图 中 的 数 


Debug - dyn/dyn.c - Eclipse Platform 

Eile Edit Refactor Navigate Search Projet Run Window Help 
|r- &|*-0-q«- |e |27 Gir t eT Or 
$ Debug 33 \ 7 n|% 
k $ u X € £3) RY 
























Y 回 dyn Debug [C/C++ Local Application] 
"v @gdb/mi (12/17/07 8:53 PM) (Suspended) 
V a? Thread [0] (Suspended) 


vi |workspace/dyn/Debug/dyn (12/17/07 8:53 PM) | 
三 1] ma workspace/dyn/dyn.c:8 0 




















ain() 
int y; 
x - (int *) malloc(25*sizeof(int)); 
scanf("XdXd" ,&x[3] ,&x[8]); 














(E Console 3 A Tasks | E: Problems| G Memory | a 
dyn Debug [C/C++ Local Application] /workspace/dyn/Debug/dyn (12/17/07 8:53 PM) 
then: then/endif not found 




















图 3-7 ”在 Eclipse 中 显示 一 个 动态 数组 
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|a 
Ei 
M 
pd 
aa 
talo 





ZH, NA 
(0,0,0,1,0,0,0,0,2,0,«repeats 16 times») 
值 1 和 2 来 目 我 们 对 程序 的 输入 ， 参 见 控 制 合 视图 。 
3.2.5 C++ 代码 的 情况 
为 了 说 明 C++ 代 人 码 的 情况 ， 下 面 古 前 和 面 用 过 的 三 又 树 示例 的 C++ 版 本 。 


// bintree.cc: routines to do insert and sorted print of a binary tree in C++ 








#include «iostream.h» 


class node { 
public: 
static class node *root; // root of the entire tree 
int val; // stored value 
class node «left; // ptr to smaller child 
class node «right; // ptr to larger child 
node(int x); // constructor, setting val = x 
static void insert(int x); // insert x into the tree 
static void printtree(class node «nptr); // print subtree rooted at *nptr 


class node *node::root = 0; 


node: :node(int x) 


val = x; 
left = right = 0; 


void node::insert(int x) 
{ 
if (node::root == 0) { 
node::root = new node(x); 
return; 


j 


class node *tmp=root; 
while (1) 
{ 
if (x < tmp-»val) 
{ 


if (tmp->left != 0) { 
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tmp - tmp-»left; 

} else { 
tmp->left = new node(x); 
break; 


} 


} else { 


if (tmp-»right != 0) { 
tmp - tmp-»right; 

} else { 
tmp->right = new node(x); 
break; 


void node::printtree(class node x«np) 
{ 
if (np == 0) return; 
node: :printtree(np->left) ; 
cout << np->val << endl; 
node: :printtree(np->right) ; 
} 
int main(int argc, char xargv[]l) 
i 
for (int i = 1; i « argc; i++) 
node: : insert(atoi(argv[i])); 
node: :printtree(node: : root) ; 


} 

仍然 与 以 前 一 样 编译 ， 并 且 一 定 要 让 编译 器 在 可 执行 文件 中 保留 符号 表 。™ 

相同 的 GDB 命 令 也 能 起 作用 ， 但 是 得 出 略 有 人 不同。 例如， 再 次 输出 insert() 中 的 tmp 指 回 对 
象 的 内 容 ， 可 以 得 到 如 下 输出 。 


(gdb) p *tmp 
$6 = {static root = 0x8049d08, val = 19, left = 0x0, right = 0x0} 


CD 不 过 ,在 这 方面 可 能 产生 各 种 各 样 的 问题 。 见 GDB 手 册 中 关于 可 执行 文件 格式 的 内 容 。 这 里 的 示例 使 用 G++ 编 译 
人 右 《GCC 的 C+t+ 包 疙 右 )， 用 -8g 选项 指定 应 当 保 留 符号 表 。 我 们 还 答 试 过 -gstabs 选 项 ， 虽 然 它 也 能 起 作用 ,但 是 
产生 的 结 采 不 太 理 想 。 
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这 类 似 于 C 程 序 的 情况 ， 只 是 现在 还 输出 了 static 变 量 node: :root 的 值 ( 它 应 当 是 该 变量 值 ， 
因为 它 是 该 类 的 一 部 分 )。 
当然 ， 必 须 记 住 ，GDB 需 要 根据 与 C++ 使 用 的 相同 作用 域 规则 来 指定 变量 。 例 如 : 











(gdb) p *root 

Cannot access memory at address OxO 

(gdb) p *node::root 

$8 = {static root = 0x8049d08, val = 12, left = 0x8049d18, right = 0x8049d28} 


我 们 需要 通过 它 的 全 名 node: :root 指 定 root。 
虽然 GDB 和 DDD 没 有 内 置 类 浏览 器 , 但 是 GDB 的 ptype 命 令 可 以 很 方便 地 快速 浏览 类 或 结构 
(struct) 的 结构 〈structure)， 例 如 : 
(gdb) ptype node 
type = class node { 
public: 
static node «root; 
int val; 
node *left; 
node *right; 


node(int); 
static void insert(int); 
static void printtree(nodex) ; 


j 


在 DDD 中 ， 可 以 右 击 闫 或 变量 名 ， 然 后 在 弹出 荣 单 中 选择 What Is 来 得 到 相同 的 信息 。 
Eclipse 中 有 Outline 视 图 ， 因 此 可 以 轻松 地 以 这 种 方式 得 到 类 信息 。 
3.2.6 监视 局 部 变量 

在 GDB 中 ， 可 以 通过 调用 info locals 命 令 列 出 当前 栈 帆 中 所 有 局 部 变量 的 值 。 

在 DDD 中 ， 甚 到 可 以 通过 单 击 Data 一 Display Local Variables 来 显示 局 部 变量 。 这 会 导致 DDD 
数据 窗口 一 个 区 域 专 门 用 来 显示 局 部 变量 《〈 当 单 步调 试 程序 时 会 更 新 )。GDB 中 似乎 没有 做 这 件 
事 的 直接 方式 , 不 过 可 以 逐个 断 点 地 做 这 件 事 : 为 希望 目 动 输出 局 部 变量 的 每 个 断 点 在 commands 
例 程 中 加 上 info locals 命 令 。 

可 以 看 到 ，Eclipse 在 Variables 视 图 中 显示 局 部 变量 。 

3.2.7 ”直接 检查 内 存 

在 有 些 情况 下 ， 可 能 希望 检查 给 定 地 址 的 内 存 ， 而 不 是 通过 变量 的 名 称 。GDB 为 这 种 目的 提 
供 了 x 命 令 ( 表 示 examine)。 在 DDD 中 , 选择 Data 一 Memory, 指定 起 点 和 字 肌 数 , 并 在 Print 和 Display 
之 间 做 选择 。Eclipse 有 一 个 Memory 视 图 ， 在 其 中 可 以 创建 Memory Monitors. 

这 主要 适用 于 汇编 语言 环境 ， 第 8 章 将 详细 讨论 。 
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3.2.8 print 和 display 的 高 级 选项 
print 和 display 命 令 允 许 指定 可 选 的 格式 。 例 如 : 


(gdb) p/x y 











会 以 十 六 进 制 格 式 显 示 变 量 ， 而 不 是 十 进 制 格式 。 其 他 第 用 的 格式 为 c 表 不 子 从 (character)，s 


表示 字符 串 〈string)，f 表 示 浮 点 (floating-point). 
可 以 临时 禁用 某 个 显示 项 。 例 如 ， 


(gdb) dis disp 1 





临时 至 用 显示 列表 中 的 条 目 1。 如 下 不 知道 条 目 写 ， 可 以 通过 info disp 命 令 检 人 脸 。 要 重新 局 用 条 


目 ， 使 用 enable， 例 如 ， 


(gdb) enable disp 1 


要 完全 删除 显示 的 条 目 ， 使 用 undisplay， 例 如 ， 


(gdb) undisp 1 





3.3 ”从 GDB/DDD/Eclipse 中 设置 变量 


在 有 些 情况 下 , 在 单 步调 试 程序 的 过 程 中 间 想 要 使 用 调试 器 设置 变量 的 值 。 这 样 可 以 快速 地 
判断 某 个 程序 错误 的 各 种 来 源 都 会 产生 怎样 的 结果 。 
在 GDB 中 ， 值 的 设置 非常 容易 ， 例 如 ， 


(gdb) set x = 12 


会 将 x 的 当前 值 改 成 12。 

DDD 中 似乎 没有 用 鼠标 来 设置 这 样 的 值 的 方式 , 但 是 同样 , 可 以 通过 DDD 控 制 台 窗口 在 DDD 
中 执行 任何 GDB 命 令 。 

在 Eclipse 中 ， 打 开 Variables 视 网 ， 右 击 要 设置 其 值 的 变量 ， 并 选择 Change Value。 然 后 可 以 
在 弹出 窗口 中 填充 独 值 。 

可 以 通过 GDB 的 set args 命 令 设置 程序 的 命令 行 参数 。 然 而 ， 与 第 1 草 介 绍 的 方法 相 比 ， 这 
种 方法 并 没有 优势 ， 第 1 章 的 方法 只 要 在 调用 GDB 的 run 命 令 时 使 用 新 参数 即 可 。 这 两 种 方法 是 完 
全 等 价 的 。 例 如 ， 如 下 代码 : 


(gdb) set args 1 52 19 11 















































并 不 会 立即 将 argv[1] 改 成 1 argv[2] 改 成 52， 等 等 , 直到 下 次 执行 run 命 令 时 才 会 发 生 这 些 变 化 。 





GDB 有 用 来 检查 当前 函数 参数 的 info _ args 命令。 当 单 击 Data 一 Display Argumentsh], DDD 
会 提供 这 一 功能 。 
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3.4 GDB 自己 的 变量 

除了 在 程序 中 声明 的 变量 外 ，GDB 还 为 其 他 变量 提供 了 一 些 机 制 。 
3.4.1 使 用 值 历史 

GDB 的 print 命 令 的 输出 值 被 标 为 $51、$2 等 ， 这 些 值 统称 为 值 历 史 。 在 将 来 执行 print 命 令 时 
使 用 这 样 的 值 历史 会 比较 方便 。 

例如 ， 考 虑 3.1 节 的 bintree 示 例 。GDB 的 部 分 会 话 可 能 如 下 所 示 。 

(gdb) p tmp-»left 

$1 = (struct node *) 0x80496a8 

(gdb) p *(tmp->left) 

$2 = {val = 5, left = 0x0, right = 0x0} 


(gdb) p *$1 
$3 = {val = 5, left = 0x0, right = 0x0} 


这 里 发 生 的 事情 是 ， 当 我 们 输出 指针 tmp->left 的 值 后 发 现 它 为 非 0， 我 们 决定 输出 这 个 指针 
指 回 的 内 容 。 我 们 输出 这 样 的 内 容 两 次 。 第 一 次 采用 方便 的 方式 ， 第 二 次 通过 值 历史 。 

在 第 三 次 输出 中 ， 我们 引用 值 历史 中 的 $1。 如 果 没 有 进行 常规 输出 ， 则 可 以 使 用 特殊 的 值 历 
史 变 量 $。 

(gdb) p tmp-»left 

$1 = (struct node *) 0x80496a8 


(gdb) p *$ 
$2 = {val = 5, left = 0x0, right = 0x0} 
































3.4.2 方便 变量 

假设 有 一 个 指针 变量 p， 它 在 不 同 的 时 候 指 问 链 表 中 的 不 同 节点 。 在 调试 会 话 期 间 ， 可 能 希 
望 记 录 特 定 节点 的 地 址 ， 比 如 ， 因 为 你 希望 重新 检查 调试 过 程 中 节点 在 不 同时 候 的 值 。 当 p 首 次 
到 达 该 节点 时 ， 可 以 这 样 做 : 


(gdb) set $q = p 
此 后 执行 的 命令 如 下 : 


(gdb) p *$q 





























这 里 的 变量 $q 称 为 方便 变量 (convenience variable). 
方便 变量 会 根据 C 规 则 改变 值 。 例 如 ， 来 看 代码 : 


int w[4] = {12,5,8,29}; 








main() 
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w[2] - 88; 
Í 


在 GDB 中 可 能 做 一 些 类 似 如 下 的 事情 。 


Breakpoint 1, main () at cv.c:7 
7 w[2] = 88; 
(gdb) n 

8 } 

(gdb) set $i = 0 
(gdb) p w[$i++] 

$1 = 12 

(gdb) 

$2 =5 

(gdb) 

$3 - 88 

(gdb) 

$4 - 29 


为 了 理解 这 里 发 生 了 什么 ， 回 顾 一 下 ， 如 果 我 们 简单 地 在 GDB 中 按 下 ENTER 键 而 没有 发 出 
命令 ，GDB 惑 会 将 这 一 操作 看 作 重 复 上 一 个 命令 的 请 求 。 在 上 面 的 GDB 会 话 中 , 保持 按 下 ENTER 
键 ， 就 意味 着 在 要 求 GDB 重 复 如 下 命令 。 


(gdb) p w[$i++] 


这 不 仅 意味 着 会 输出 一 个 值 ， 而 且 方便 变量 9i 也 会 递增 。 














说 明 ”几乎 可 以 为 方便 变量 选择 任何 名 称 ， 不 过 有 一 些 例外 。 例 如 ， 不 能 给 方便 变量 起 名 为 $3， 
为 那 是 为 值 历史 保留 的 名 称 。 另 外 ， 如 果 用 的 是 汇编 语言 ， 则 不 应 使 用 寄存 器 名 称 。 例 如 ， 
对 于 Intel x86 系 列 机 器 ， 有 一 个 寄存 器 didi pii 在 GDB 中 它 被 称 为 geax， 如 果 在 汇编 语言 
层 上 工作 ， 则 不 要 选择 这 个 名 称 作为 方便 变 
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ACTER F ERKE eX EA EDDA INCHES] PECES BECA BEA) va 28 HH FE Y ORS 
Jh. BARAI AEE AMH, (HIEUZSTEUY G8 iR. 

BAA, CH Set RD AAD SASS AM, RADA REECE Hi PE BU JU SC 
现时 ，C 语 言 才 比 较 小 ， 实 际 上 这 个 库 相 当 庞 大 。 而 且 很 多 程序 员 认 为 C 语 言 是 易 用 语言 ， 那 是 
因为 他 们 还 没有 过 到 指针 。 

般 而 言 ， 程 序 错误 会 导致 下 面 两 件 事 的 发 生 。 

Qa 导 化 程序 做 一 些 程序 员 没 有 打算 做 的 事 。 这 样 的 程序 错误 通常 因为 逻辑 缺陷 ， 比 如 在 第 3 
章 的 数字 排序 程序 中 ， 将 节点 放 在 了 树 的 错误 分 文 上 。 到 目前 为 止 我 们 一 直 在 集中 介绍 
这 种 程序 错误 。 

O 导致 程序 “爆炸 ”或 “崩溃 ”。 这 些 程序 错误 通常 与 指针 的 误 操 作 或 误 用 有 关 。 这 是 本 章 
将 介绍 的 程序 错误 类 型 。 


4.1 BRAN: AEE 


当 程序 骨 省 时 到 撒 发 生 了 什么 事 ? 我 们 这 里 将 解释 一 下 , HRE I 77 HERB DIT RET VA 
ATA TR 


41.1 为 什么 程序 会 表演 


用 编程 界 的 行 话 说 ， 当 某 个 错误 导致 程序 突然 和 异常 地 停止 执行 时 ， 程 序 毅 渍 。 迄 今 最 常见 
的 导致 程 序 骨 尝 的 原因 是 试图 在 未 经 允许 的 情况 下 访问 一 个 内 存 位 置 。 便 件 会 感知 这 件 事 ， 并 执 
行 对 操作 系统 (OS) 的 跳 转 。 在 本 书 主要 使 用 的 Unix 系 列 的 平台 上 ， 操 作 系 统一 般 会 宣布 程序 
导致 了 段 错误 (seg fault)， 并 停止 程序 的 执行 。 在 微软 的 Windows 系 统 上 ， 对 应 的 术语 是 一 般 保 
护 错误 (general protection fault)。 无 论 是 哪个 名 称 ， 硬 件 都 必须 文 持 虚 拟 内 存 ， 而 且 操 作 系 统 必 
须 使 用 虚拟 内 存 才 会 发 生 这 个 错误 。 虽 然 这 是 如 今 的 通用 计算 机 的 标准 ， 但 是 读者 应 记 住 ， 专 用 
的 小 型 计算 机 一 般 没 有 这 种 情况 ， 比 如 用 来 控制 机 器 的 租 入 式 计 算 机 。 

为 了 有 效 地 使 用 GDB/DDD 处 理 段 错误 ， 醒 要 的 是 要 真正 理解 内 存 访问 错误 是 如 何 发 生 的 。 
在 下 面 几 页 中 ， 我 们 简要 介绍 一 下 虚拟 内 存 (VM) 在 程序 执行 期 间 所 起 的 作用 。 我 们 将 把 焦点 
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放 在 虚拟 内 存 问 题 与 段 错误 之 间 的 关系 上 。 因 此 ， 即 使 你 在 计算 机 课程 中 学 习 过 虚拟 内 存 ， 本 节 
介绍 的 内 容 仍 然 可 以 帮助 你 处 理 调 试 工作 中 的 段 错 误 。 
41.2 内存 中 的 程序 布局 

正如 前 面 提 到 的 ， 当 程序 中 有 内 存 访问 问题 时 ， 会 发 生 段 错误 。 为 了 讨论 这 件 事 ， 重 要 的 是 
先 理解 程序 在 内 存 中 是 如 何 布局 的 。 

在 Unix 平 台 上 ， 为 程序 分 配 的 虚拟 地 址 的 布局 通常 类 似 于 图 4-1。 

















图 4-1 程序 内 存 布局 

这 里 虚拟 地 址 0 在 最 下 方 ， 箭 头 显 示 了 其 中 两 个 组 件 〈 扒 和 栈 ) 的 增长 方 回 ， 当 它们 增长 时 ， 

消耗 掉 未 使 用 的 自由 区 域 。 各 个 部 分 的 作用 如 下 所 示 。 

O 文本 区 域 ， 由 程序 源 代 码 中 的 编译 亏 产 生 的 机 器 指令 组 成 。 例 如 ， 每 行 C 代 码 通 间 会 转换 
成 两 到 三 条 机 器 指令 ， 所 有 结果 指令 的 集合 组 成 了 可 执行 文件 的 文本 部 分 。 这 个 部 分 的 
正式 多 称 是 .text。 

这 一 组 件 包括 前 态 链 接 代 人 码 ， 包 括 做 初始 化 工作 然后 调用 main() 的 系统 代 人 码 /usr/ib/ 
crt0.0。 

O 数据 区 域 ， 包 含 在 编译 时 分 配 的 所 有 程序 变量 ， 即 全 局 变量 。 
实际 上 ,这 个 区 域 由 各 种 各 样 的 子 区 域 组 成 。 第 一 个 子 区 域 称 为 .data， 由 初始 化 过 的 变量 
组 成 ， 即 在 如 下 所 示 的 声明 中 给 出 的 变量 。 





























int x = 5 
还 有 一 种 用 于 存放 未 初始 化 数据 的 .pss 区 域 ， 在 如 下 所 示 的 声明 中 给 出 。 
int y; 


当 程 序 在 运行 时 从 操作 系统 中 请 求 额外 的 内 存 时 (例如 ， 当 在 C 语 言 中 调用 malloc() 时 ， 
或 者 在 C++ 中 调用 new 结 构 时 ),， 请 求 的 内 存在 名 为 堆 的 区 域 中 分 配 。 如 末 堆 空间 不 够 ,可 
以 通过 调用 brk() 来 扩展 扒 《〈 这 正 是 malloc() 及 相关 函数 所 做 的 事情 )。 


E 
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O 栈 区 域 ， 是 用 来 动态 分 配 数 据 的 空间 。 函 数 调用 的 数据 《包括 参数 、 局 部 变量 和 返回 地 
址 ) 都 存储 在 栈 上 。 每 次 进行 函数 调用 时 栈 都 会 增长 ， 每 次 函数 返回 到 其 调用 者 时 栈 都 


RHF o 











a 图 4-1 中 没有 显示 程序 的 动态 链接 代码 ， 它 的 位 置 与 平台 有 关 ， 但 是 它 确实 在 茶 个 地 方 


存在 。 


让 我 们 稍微 探究 一 下 。 来 看 如 下 代码 。 


int q[200]; 


int main( void ) 
i 


int i, n, *p; 


p = malloc(sizeof(int)); 


scanf ("%d", &n); 


for (i = 0; i < 200; 


qli] = i; 
printf("%x %x 


return 0; 


} 


i++) 





AX ^ *X\n", main, q, p, &i, scanf); 


虽然 该 程序 本 身 作 用 并 不 大 , 但 是 我 们 将 它 编 号 成 一 个 工具 来 非 正 式 地 探索 虚拟 地 址 空间 的 
布局 。 出 于 这 个 目的 ， 让 我 们 运行 以 下 程序 。 


为 a.out 
5 


80483f4 80496a0 209835008 btfb3abec 











从 运行 结果 可 以 看 到 文本 区 域 、 数 据 区 域 、 堆 、 栈 和 动态 链接 函数 的 大 体位 


8048304 


6x686483f4、6x686496a6、6x69835668、6xbfb3abec 和 6x688648364。 
可 以 通过 三 看 这 一 过 程 的 maps 文 件 来 得 到 程序 在 Linux 上 的 精确 内 存 布局 情况 。 这 个 过 程 号 








是 21111， 因 此 我 们 将 查看 相应 的 文件 /jproc/21111maps。 


$ cat /proc/21111/maps 
009f1000-009f2000 r-xp 
009f2000-00a0b000 r-xp 
O0a0b000-00a0c000 r-xp 
O00a0c000-00a0d000 rwxp 
O0a0f000-00b3c000 r-xp 
00b3c000-00b3e000 r-xp 
00b3e000-00b3f000 rwxp 
00b3f000-00b42000 rwxp 
08048000-08049000 r-xp 


0091000 
00000000 
00018000 
00019000 
00000000 
0012d000 
0012f000 
00b3f000 
00000000 


:00 
:01 
:01 
:01 


0 

4116750 
4116750 
4116750 
4116819 
4116819 
4116819 
0 


18815309 


| vdso | 
/lib/1d-2.4.s0 
/lib/ld-2.4.so 
/lib/ld-2.4.s0 
/lib/libc-2.4.so 
/lib/libc-2.4.so 
/lib/libc-2.4.so 


/home/matloff/a.out 
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08049000-0804a000 rw-p 00000000 00:16 18815309  /home/matloff/a.out 
09835000-09856000 rw-p 09835000 00:00 0 [heap | 
b7ef8000-b7ef9000 rw-p b7ef8000 00:00 0 

b7f14000-b7f16000 rw-p b7f14000 00:00 0 

bfb27000-bfb3c000 rw-p bfb27000 00:00 0 [ stack] 


你 不 需要 理解 所 有 这 些 代码 。 重 点 是 在 该 显示 结果 中 ,可 以 看 到 文本 和 数据 区 域 ( 从 文件 q.out 
中 )， 以 及 堆 和 栈 。 从 中 也 可 以 看 到 C 库 〈 对 于 调用 scanf()、malloc() 和 printf()) 被 放 在 何 处 
(从 文件 Lip/Nibc-2.4.s0o)。 此 外 还 应 识别 出 一 个 权限 字段 ， 其 格式 类 似 于 使 用 显示 的 文件 权限 ， 
比如 表示 rw-p 这 样 的 权限 。 后 者 很 快 束 会 介绍 。 


4.1.3 ”页 的 概念 


图 4-1 所 示 的 虚拟 地 址 空间 概念 上 从 0 延伸 到 2”-1， 其 中 w 是 机 器 上 按 位 表示 的 单词 大 小 。 当 
然 ， 程序 通 党 只 会 使 用 该 空间 的 很 少 一 部 分 ， 操 作 系 统 可 能 保留 空间 的 一 部 分 给 自己 用 。 但 是 程 
序 员 编 写 的 代码 可 以 通过 指针 在 该 范围 内 的 任何 地 方 生成 地 址 。 通常 这 样 的 地 址 会 是 错误 的 ， 原 
因 在 于 程序 中 有 程序 错误 ! 

虚拟 地 址 空间 是 通过 组 织 成 称 为 页 Cage) 的 块 来 得 看 的 。 在 Pentium 便 件 上 ， 默 认 页 大 小 是 4 096 
学 节 。 物 理 内 存 〈 包 括 RAM 和 ROM) 也 都 是 分 成 页 来 查看 的 。 当 程序 被 加 载 到 内 存 中 执行 时 ， 操 作 
系统 会 安排 程序 的 部 分 页 存储 在 物理 内 存 的 页 中 。 这 些 页 称 为 被 “ 驻 留 ” 其 余部 分 存储 在 人 磁 各 上 。 

在 执行 期 间 的 各 个 阶段 ， 将 需要 一 些 当 前 没有 驻 留 的 程序 页 。 当 发 生 这 种 情况 时 ， 硬 件 会 感 
知 到 ， 将 控制 权 转 移 给 操作 系统 。 后 者 将 所 需 页 带 到 内 存 中 ， 可 能 会 伏 换 挥 当 前 驻 留 的 男 一 个 程 
序 页 〈 如 果 没 有 可 用 的 上 自由 内 存 页 )， 然 后 将 控制 权 返 回 给 程序 。 如 果 有 被 驱逐 的 程序 页 ， 束 会 
变 成 非 驻 留 页 ， 被 存储 在 人 磁盘 上 。 

为 了 管理 所 有 这 些 操作 ， 操 作 系 统 为 每 个 过 程 设立 了 一 个 页 表 (page table)。(Pentium 的 页 表 
有 一 个 层次 结构 , 但 是 这 里 为 了 简单 起 见 , 我 们 假定 只 有 一 层 , 而且 这 里 讨论 的 大 多 数 内 容 都 不 是 
Pentium 特 有 的 。 〉 这 一 过 程 的 每 个 虚拟 页 在 表 中 都 有 对 应 的 一 个 项 (entry)， 其 中 包括 如 下 信息 。 

a 这 个 页 在 内 存 中 或 者 磁盘 上 的 当前 物理 位 置 。 如 果 是 在 破 盘 上 ， 页 表 上 对 应 的 项 会 指示 

页 是 非 驻 留 的 ， 可 能 包含 一 个 指针 ， 指 回 最 终 导 致 磁盘 上 的 物理 位 置 的 一 个 列表 。 例 如 ， 
它 可 能 显示 : 程序 的 虚拟 页 12 是 驻 留 的 ， 位 于 内 存 的 物理 页 200 中 。 

Q 该 页 的 权限 分 3 种 : 读 、 写 和 执行 。 

注意 ， 操 作 系统 不 会 将 不 完整 的 页 分 配给 程序 。 人 例如， 如果 要 运行 的 程序 总 共 大 约 有 10 000 
学 廊 ， 如 果 完 全 加 载 ， 会 占 3 个 内 存 页 。 它 不 会 仅 占 2.5 个 页 ， 因 为 页 是 虚拟 内 存 系 统 能 够 操作 的 
最 小 内 存单 元 。 这 是 调试 时 要 记 住 的 很 重要 的 一 点 ， 因 为 正如 下 面 将 介绍 的 ， 这 一 点 暗示 了 程序 
的 一 些 错误 内 存 访 问 不 会 触发 段 错误 。 换 言 之 ， 在 调试 会 话 期 间 ， 不 能 这 么 想 :“ 这 行 代 人 码 一 定 
没 问 题 ， 因 为 它 没 有 3 引起 段 错 误 。” 
4.1.4 页 表 的 作用 

采用 图 4-1 中 的 虚拟 地 址 空间 ,继续 假设 页 大 小 为 4096 字 和 节 。 然后 虚拟 页 0 包含 虚拟 地 址 空间 
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的 第 0~4 095 字 节 ， 页 1 包含 第 4 096~8 191 字 节 ， 以 此 类 推 。 

表面 提 到 ， 当 我 们 运行 程序 时 ， 操 作 系 统 创建 一 个 用 来 管理 执行 程序 代码 进程 的 虚拟 内 存 页 
Ro (第 $ 章 介绍 线程 时 将 概述 操作 系统 进程 .) 每 当 该 进程 运行 时 ， 人 硬件 的 页 表 寄存 器 都 会 指 问 
UK. 

从 概念 上 讲 ， 进 程 虚拟 地 址 空间 的 每 个 页 在 页 表 中 都 有 一 个 页 表 项 《在 实践 中 ， 可 以 使 用 各 
种 技巧 来 压缩 该 表 )。 这 个 页 表 项 存储 与 该 页 相关 的 各 块 信息 。 与 段 错误 相关 的 数据 是 该 页 的 访问 
权限 ， 它 类 似 于 文件 访问 权限 : 读 、 写 和 执行 。 例 如 ， 页 3 的 页 表 项 将 指出 进程 是 否 具 有 从 该 页 读 
取 数 据 的 权限 ， 癌 该 页 中 写 数 据 的 权限 ， 以 及 在 该 页 上 执行 指令 的 权限 (如 果 页 中 包含 机 器 码 )。 

当 程 序 执行 时 ， 它 会 如 上 文 所 述 连续 访问 各 个 区 域 ， 导 致 便 件 按 以 下 几 种 情况 处 理 页 表 。 

Q 每 次 程序 使 用 其 全 局 变量 时 ， 需 要 具有 对 数据 区 域 的 读 / 写 访问 权限 。 

O 每 次 程序 访问 局 部 变量 时 ， 程 序 会 访问 栈 ， 需 要 对 栈 区 域 具 有 恋 / 写 访问 权限 。 

O 每 次 程序 进入 或 离开 函数 时 ， 会 对 该 栈 进 行 一 次 或 多 次 访问 ， 需 要 对 栈 区 域 具 有 读 写 访 

问 权 限 。 
O 每 次 程序 访问 通过 调用 malloc() 或 new 创 建 的 存储 空间 时 ， 都 会 发 生 堆 访问 ， 也 需要 该 / 
写 访 问 权 限 。 

a 程序 执行 的 每 个 机 器 指令 都 是 从 文本 区 域 (或 者 从 动态 链接 代码 的 区 域 〉 取 出 的 ， 因 此 

需要 具有 该 和 执行 权限 。 

在 程序 的 执行 期 间 ， 生 成 的 地 址 会 是 虚拟 的 。 当 程序 试图 访问 某 个 虚拟 地 址 处 的 内 存 时 ， 比 
如 》， 便 件 驶 会 将 其 转换 成 虚拟 页 号 w， 它 等 于 y 除 以 4096《〈 其 中 除法 是 整除 算法 ， 舍 去 余数 )。 然 
后 便 件 会 检查 页 表 中 的 页 表 项 v 来 得 看 访 页 的 权限 是 否 与 要 执行 的 操作 匹配 。 如 果 匹 配 ， 便 件 束 
会 从 这 个 表 项 中 得 到 所 需 位 置 的 实际 物理 页 号 ， 然 后 完成 请 求 的 内 存 操作 。 但 是 如 和 果 该 表 项 显示 
请 求 的 操作 不 具有 恰当 的 权限 ， 人 硬件 驶 会 执行 内 部 中 断 。 这 会 导致 跳 转 到 操作 系统 的 错误 处 理 例 
程 。 然 后 ， 操 作 系统 一 般 会 宣告 一 个 内 存 访 问 违 例 ， 并 停止 程序 的 执行 〈 即 从 进程 表 和 内 存 中 去 
挥 程序 )。 

程序 中 的 错误 会 导致 权 限 不 匹配 ,并 在 上 面 列 出 的 某 个 类 型 的 内 存 访 问 期 间 生 成 段 错 误 。 例 
如 ， 假 设 程序 中 包含 如 下 全 局 声明 : 


int x[100]; 

并 假设 代码 包含 下 面 这 条 语句 : 

在 C/C++ 中 ， 表 达 式 x[i] 等 价 于 《实际 上 也 意味 看 ) *(x+i)， 即 地 址 x+i 指 回 的 内 存 位 置 的 
内 容 。 如 采 佣 移 量 i 为 200 000， 那 么 这 个 表达 式 可 能 会 产生 虚拟 内 存 地 址 >， 它 超出 了 操作 系统 
为 该 程序 的 数据 区 域 指定 的 页 组 范围 (编译 器 和 连接 程 订 为 数组 x[] 安 排 的 存储 地 方 )。 然 后 当 试 
图 执行 号 操作 时 会 发 生 段 销 诈 。 

如 来 x 是 局 部 变量 ， 那 么 会 在 栈 区 域 友 生 同 样 的 问题 。 
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与 执行 权限 相关 的 违例 的 产生 更 微妙 。 例 如 ， 在 汇编 语言 程序 中 ,假设 有 一 个 名 为 sink 的 数 
据 项 和 一 个 名 为 sunk() 的 函数 。 当 调用 这 一 函数 时 ， 可 能 不 小 心 写成 





call sink 
而 不 是 

call sunk 

这 会 导致 一 个 段 错 误 ， 因 为 程序 会 试图 在 sink 的 地 址 处 执行 指令 ， 访 地址 位 于 数据 区 域 ， 而 
数据 区 域 的 页 没有 局 用 执行 权限 。 

C 语 言 中 类 似 这 样 的 编码 错误 不 会 导致 段 错误 ， 因 为 当 将 sink 声 明 为 变量 时 ， 编 译 堪 会 以 如 
下 这 行 代码 为 目标 : 


z = Sink(5); 
但 是 在 使 用 指向 函数 的 指针 时 ， 很 容易 发 生 这 种 程序 错误 。 来 看 如 下 的 代码 。 


int f(int x) 
{ 




















return X*X; 


} 
int (*p)(int); 


int main( void ) 


{ 
p= f; 
u = (*p)(5); 
printf("%d\n", u); 
return 0; 
} 











Hemu Sie ap = f: ， 那 么 p 会 为 0， 你 将 试图 执行 位 于 页 0 的 指令 ， 而 你 不 具有 对 这 个 页 
的 执行 〈 或 其 他 ) 权限 (参见 图 4-1)。 
4.1.5 ”轻微 的 内 存 访 问 程 序 错误 可 能 不 会 导致 段 错误 

为 了 加 深 对 有 段 错 误 发 生 方式 的 理解 ， 来 看 如 下 代码， 当 执 行 该 代码 时 ， 其 行为 表明 : 在 预料 
到 有 段 错 误 的 地 方 不 一 定 都 会 发 生 段 错误 。 


int g[200]; 











main() 


{ 


int i; 
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for (i = 0; i « 2000; i++) { 
qli] = i; 
Í 
} 


注意 ， 这 名 程序 员 显然 在 循环 中 有 笔 误 ， 设 置 了 2 000 次 迭代 ， 而 不 是 200 次 。 无 论 数组 索引 
是 否 超出 了 边界 ，C 语 言 编译 器 在 编译 时 不 会 捕获 这 一 错误 ， 编 译 器 生成 的 机 器 码 在 执行 时 也 不 
会 检查 该 错误 。( 这 是 GCC 的 错误 ， 尽 管 它 还 具有 不 提供 这 样 的 运行 时 索引 检查 的 -fmudflap 选 
项 。) 

在 执行 时 ， 很 可 能 发 生 段 错误 。 然 而 ,错误 发 生 的 时 机 可 能 让 人 人 大吃一惊。 这 种 错误 可 能 不 
是 出 现在 “自然 ”时 间 ， 即 当 i=200 时 ， 相 反 ， 它 可 能 出 现在 那个 时 刻 后 面 很 久 。 

为 了 说 明 这 一 点 , 我 们 在 Linux PC 上 的 GDB 下 运行 该 程序 , 这 样 可 以 方便 地 查询 变量 的 地 址 。 
结果 发 现 段 错误 不 是 发 生 在 i=200 处 ， 而 是 在 i=728 处 。( 你 的 系统 可 能 会 给 出 不 同 的 结果 ， 但 原 
理 是 一 样 的 .) 让 我 们 看 一 下 原因 。 

通过 对 GDB 的 查询 ， 我 们 发 现 数组 q[] 在 地 址 ex8e497bf 处 结束 ， 即 q[199] 的 最 后 一 字 节 在 该 
内 存 人 位置。 考虑 到 Intel 的 页 大 小 是 4 096 字 节 ， 这 种 机 器 是 32 位 的 字 大 小 ， 所 以 一 个 虚拟 地 址 被 分 
解 为 一 个 20 位 的 页 号 和 一 个 12 位 的 偏 移 量 。 在 本 市 的 示例 中 ，q[] 在 虚拟 页 号 6x8849=32841 处 结 
束 ， 偶 移 量 为 ex7bf=1983。 因 此 ， 分 配 了 q 的 内 存 的 页 上 仍然 有 4 096-1 984=2 112 字 和 。 访 空间 
可 以 存放 2 112/4=528 个 整数 变量 〈 因 为 这 里 使 用 的 机 器 上 每 个 变量 是 4 字 节 宽 )， 本 节 示 例 的 代码 
似乎 认为 包含 q 的 元 素 的 位 置 是 在 200 一 727 之 间 。 

当然 ，q[] 的 那些 元 素 不 存在 ， 但 是 编译 器 没有 抱 奶 。 人 硬件 也 没有 抱 扰 ， 因 为 这 种 写 操作 仍 
然 是 在 我 们 肯定 上 共有 写 权 限 的 页 上 执行 的 《因为 q[] 的 部 分 实际 元 素 位 于 该 数据 段 上 ， 且 在 其 中 
分 配 了 q[])。 只 有 当 i 变 成 728 时 ，q[i] 才 引用 不 同 页 上 的 地 址 。 在 这 种 情况 下 ， 它 就 是 我 们 不 具 
有 写 权限 (或 任何 其 他 权限 〉 的 页 ;虚拟 内 存 便 件 检测 到 这 一 点 ， 并 触发 一 个 段 错误 。 

由 于 每 个 整数 变量 都 存储 在 4 学 节 中 ， 因 此 这 个 页 包含 S28 (2112/40 个 额外 的 “ 约 影 ”元 素 ， 
代码 将 它 作 为 属于 数组 q[] 对 符 。 因 此 ， 虽 然 我 们 没有 打算 让 它 这 样 处 理 ， 但 是 访问 q[26e8]， 
q[261]… 一 直到 元 素 199+5$18=727， 即 q[727] 仍 然 是 合法 的 ， 不 会 触发 段 错 误 ! UH AE UI WI 
q[728] 时 才 会 遇 到 新 页 ， 你 可 能 有 也 可 能 没有 对 它 的 必需 访问 权限 。 这 里 ， 我 们 不 具有 对 该 页 的 
访问 权限 ， 因 此 发 生 了 段 错误 。 然 而 ， 下 一 个 页 可 能 侥幸 具有 指定 给 它 的 恰当 权限 ， 然 后 还 会 有 
更 多 幻影 数组 元 素 。 

总 结 : 正如 早先 所 介绍 的 ， 不 能 根据 没有 发 生 段 错误 来 得 出 结论 认为 内 存 操作 是 正确 的 。 
41.6 ” 段 错 误 与 Unix 信 和 号 

在 上 面 的 讨论 中 ， 我 们 说 段 错误 一 般 会 导致 程序 的 中 止 。 昌 然 这 是 正确 的 ， 但 是 想 要 认真 彻 
底 地 调试 ， 还 应 该 了 解 有 关 Unix 信 和 号 的 内 容 。 

fe (signal) 表示 在 程序 执行 期 间 报 告 的 异常 情况 ， 人 允许 操作 系统 〈 或 程序 员 上 自己 的 代码 ) 
反映 多 种 事件 。 信 和 号 可 能 在 某 个 进程 上 由 系统 的 底层 硬件 抛 出 〈SIGSEGV 或 SIGFPE)， 或 者 由 操作 
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系统 抛 出 〈《SIGTERM 或 SIGABRT)， 或 者 由 另 一 个 进程 抛 出 〈SIGUSR1 或 SIGUSR2 )， 甚 至 可 能 由 该 进 
程 本 身 发 送 (通过 raise() 库 调用 )。 

最 简单 的 信号 示例 为 : 当 程 序 正 在 运行 时 按 下 键盘 上 的 Ctrl+C 组 合 键 。 按 下 〔〈 或 释放 ) 键盘 
上 的 任何 键 ， 都 会 生成 导致 操作 系统 例 程 运行 的 硬件 中 断 。 当 按 下 Ctrl+C 组 合 键 时 ， 操 作 系 统 认 
出 这 种 键 组 合 是 一 个 特殊 模式 ， 并 为 控制 终端 上 的 进程 抛 出 一 个 名 为 SIGINT 的 信和 号。 通常 的 说 法 
是 操作 系统 “ 回 进 程 发送 一 个 信号 ”。 我 们 将 采用 这 种 说 法 ， 但 是 重要 的 是 要 意识 到 实际 上 没有 
任何 内 容 “ 发 送 ” 给 进程 。 所 友 生 的 事情 只 不 过 是 操作 系统 将 信号 记录 到 进程 表 中 ， 以 便 下 次 进 
程 接收 信号 时 得 到 CPU 上 的 时 间 片 ， 执 行 恰当 的 信号 处 理 程 序 ， 下 面 将 会 解释 。( 然 而 ， 假 设 有 
紧急 信号 ， 操 作 系 统 也 可 能 会 决定 让 接收 进程 的 下 一 个 时 间 所 稍 早 于 其 他 进程 。) 

一 个 进程 上 可 以 发 出 很 多 种 不 同 的 信号 。 在 Linux 中 ， 可 以 通过 在 shell 提 示 符 后 面 键入 如 下 
代码 来 列 出 全 部 的 信号 。 























man 7 signal 











言 号 的 定义 有 多 种 标准 ， 比 如 POSIX.1， 这 些 信 号 会 出 现在 所 有 兼容 的 操作 系统 上 。 还 有 个 
别 操作 系统 独 有 的 信号 。 

每 个 信号 都 有 自己 的 信号 处 理 程序 ， 这 是 当 进 程 友 出 特定 信号 时 调用 的 函数 。 回 到 我 们 的 
Ctrl+C 示 例 中 ， 当 发 现 SIGINT 时 ， 操 作 系统 将 进程 的 当前 指令 设置 在 该 特定 信和 号 的 信和 号 处 理 程序 
的 开端 。 因 此 ， 妆 进程 恢复 时 ， 它 会 执行 该 处 理 程序 。 

每 种 类 型 的 信号 有 一 个 默认 信号 处 理 程序， 除非 实在 需要 ， 否则 束 不 必 亲 日 编写 信号 处 理 程 
序 。 默 认 情 况 下 ， 忽 略 大 多 数 无 害 信 和 号。 有些 类 型 的 信号 较 严 重 ， 比 如 违反 内 存 访 问 权 限 产生 的 
言 号 ， 表 示 出 现 了 程序 不 能 或 不 应 继续 执行 的 情况 。 在 这 样 的 情况 下 ， 默 认 信 和 号 处 理 程 序 会 直接 
终止 程序 。 

虽然 有 些 信 号 处 理 程序 不 能 被 重 写 , 但 是 在 很 多 情况 下 可 以 编写 目 己 的 处 理 程序 来 芋 换 操作 
系统 提供 的 默认 处 理 程 序 。 在 Unix 下 就 可 以 用 signal() 或 sigaction() 两 个 系统 调用 。2 例如， 你 
的 目 定 义 处 理 程序 函数 可 以 忽略 信号 ， 甚 全 可 以 要 求 用 户 选择 一 个 做 法 。 

为 了 增加 趣味 性 ， 我 们 编号 了 一 个 程序 来 说 明 如 何 编写 目 己 的 处 理 程序 ， 并 使 用 signal() 
调用 或 重 写 默认 操作 系统 处 理 程 序 ， 或 者 忽略 信和 号。 我 们 选择 了 SIGNIT， 但 是 可 以 对 可 被 捕获 的 
任何 信号 做 相同 的 事情 。 该 程序 还 演示 了 如 何 使 用 raise()。 












































#include «signal.h» 
#include <stdio.h> 


void my sigint handler( int signum ) 


{ 


CD 有 两 个 函数 可 用 来 重 写 默认 信号 处 理 程序 ， 因 为 和 其 他 Unix 系 统一 样 ，Linux 也 遵循 多 个 标准 。signal() 函 数 比 
sigaction() 更 容易 使 用 ， 它 遵循 ANSI 标 准 ; 而 sigaction() 函 数 较 复杂 ， 但 是 也 更 多 样 化 ， 它 遵循 POSIX 标 准 。 
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printf("I received signal Xd (that's 'SIGINT' to you). Mn", signum); 
puts("Tee Hee! That tickles! Wn"); 


int main(void) 


{ 


char choicestr|20| 


int choice; 


while ( 1 ) 

i 
puts("1. Ignore control-C"); 
puts("2. Custom handle control-C"); 
puts("3. Use the default handler control-C"); 
puts("4. Raise a SIGSEGV on myself."); 
printf("Enter your choice: "); 


hanai tr ora stdi ne 
Lu cU 2 LUL Ils y 


( 
\ J 
sscanf(choicestr, "Xd", &choice); 


if ( choice == 1 ) 
signal(SIGINT, SIG IGN); // Ignore control-C 
else if ( choice -- 2 ) 
Signal(SIGINT, my sigint handler); 
else if ( choice -- 3 ) 
signal(SIGINT, SIG DFL); 
else if ( choice == 4 ) 
raise(SIGSEGV); 


Ale 
ELSE 


puts("Whatever you say, guv'nor.\n\n"); 


return 0; 


} 


当 程 序 违 反 内 存 访问 权限 时 ， 在 进程 上 发 出 SIGSEGV 信 和 号。 默认 段 错 误 处 理 程序 终止 该 进程 ， 
并 辣 磁 航 上 写 一 个 “核心 文件 ”( 很 快 会 介绍 )。 

如 果 和 希望 保持 程序 有 效 ， 而 不 是 允许 程序 被 终止 ， 则 可 以 为 SIGSEGV 编 号 一 个 上 自 定 义 处 理 
程序 。 事 实 上 ， 有 时 可 能 要 故意 导致 段 错误 ， 以 便 使 某 种 工作 得 以 完成 。 例 如 ， 有 些 并 行 处 理 
软件 包 使 用 人 为 段 错误 ， 会 有 特殊 处 理 程 序 响 应 这 种 错误 以 保持 系统 各 个 环节 之 间 的 一 致 性 ， 
4.3 市 将 会 介绍 。 第 7 草 将 介绍 sSIGSEGV 的 一 些 专 用 处 理 程 序 的 男 一 类 用 途 , 涉及 检测 段 错 误 并 优 
雅 地 做 出 反应 的 一 些 工 具 。 
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然而 ， 使 用 GDB/DDDV/Eclipse 时 ， 目 定义 信和 号 处 理 程序 可 能 会 使 程序 变 复杂 。 无 论 是 直接 使 
用 还 是 通过 DDD GUI， 每 当 发 出 任何 信号 时 ，GDB 都 会 停止 进程 。 在 刚刚 提 到 的 类 似 于 并 行 处 
理 软件 应 用 程序 中 , 这 意味 着 GDB 会 因为 与 调试 工作 无 关 的 原因 而 非常 频繁 地 停止 。 为 了 处 理 这 
种 情况 ， 需 要 使 用 handle 命 令 告诉 GDB 在 某 些 信号 发 生 时 不 要 停止。 


4.1.7 ”其 他 类 型 的 异常 


除了 段 错误 以 外 , 还 有 一 些 其 他 原因 也 会 导致 月 泪 。 浮 点 异 第 (Floating-point exception, FPE) 
导致 发 出 STGFPE 信 和 号。 虽然 这 个 信号 被 称 为 “ 浮 点 ” 异 营 ， 但 是 它 也 包括 整数 算术 异常 ， 比 如 谥 
出 和 除 以 0 的 情况 。 在 GNU 和 BSD 系 统 上 ， 传 递 给 FPE 处 理 程序 的 第 二 个 参数 指出 了 FPE 的 原因 。 
默认 处 理 程序 在 有 些 情况 下 《比如 浮 点 溢出 ) 将 忽略 STIGFPE， 在 另外 一 些 情况 下 《比如 整数 除 以 
0) 则 终止 进程 。 
当 CPU 在 执行 机 禹 指令 期 间 在 总 线 上 检测 到 反常 情况 时 , 会 发 生 总 线 错 误 。 不 同 的 涤 构 对 总 
线 上 发 生 的 事情 有 不 同 的 要 求 , 这 种 反 第 的 确切 原因 取决 于 上 其 体 的 架构 。 导 仅 忌 线 蚀 误 的 部 分 情 
况 举 例如 下 。 
a 访问 不 存在 的 物理 地 址 。 这 不 同 于 段 错误 ， 段 错误 涉及 访问 不 具备 足够 权限 的 内 存 。 段 
错误 是 权限 的 问题 ， 总 线 错误 则 是 由 于 提供 给 处 理 需 的 是 无 效 地 址 。 
a 在 很 多 混 构 上 ， 要 求 访问 32 位 量 的 机 器 指令 要 求 字 对 齐 ， 即 这 个 量 的 内 存 地 址 必须 是 4 的 
倍数 。 导 致 试图 在 奇数 号 地 址 上 访问 具有 4 字 节 的 数 的 指针 错误 可 能 会 引起 总 线 错误 。 
在 x86 架 构 上 运行 Linux 时 ,下面 这 个 程序 不 会 引起 总 线 错 误 ， 因为 这 些 处 理 器 未 对 齐 的 内 
存 地 址 也 是 合法 的 ， 它 们 只是 执行 起 来 比 对 齐 访问 慢 而 已 。 
int main(void) 
i 


char «char ptr; 


int xint ptr: 
A = i up" m3 
























































int int arrayl2]; 


// char ptr points to first array element 
char ptr - (char x) int array; 


// Causes int ptr to point one byte past the start of an existing int. 


usr basta 4 IC 
ff STILE dll Lik Cail & be UVIILY. Vie VY Le, lit pur to I 


int ptr = (int *) (char ptr«1); 








*int ptr = 1; // And this might cause a bus error. 
return 0; 
j 
JGWE WIPE OL, PIE ce db laser, T EUn R AI SIGBUS{a 7. BAWA UL 


下 ，SIGBUSs 会 导致 进程 转 储 核心 并 立即 终止 。 
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42 核心 文件 


正如 前 面 所 提 到 的 ， 有 些 信号 表示 让 某 个 进程 继续 是 不 妥当 ， 甚 至 是 不 可 能 的 。 在 这 些 情 况 
中 ， 默 认 动作 是 提前 终止 进程 ， 并 编写 一 个 名 为 核心 文件 〈core file) 的 文件 ， 俗 称 转 储 核心 。 
你 的 shell 可 能 会 禁止 编写 核心 文件 (参见 4.2.2 节 了 解 详 细 信 息 )。 

如 果 在 程序 运行 期 间 创建 了 核心 文件 ， 则 可 以 对 该 文件 打开 调试 器 (比如 GDB)， 然 后 开始 
常规 GDB 操 作 。 


4.2.1 核心 文件 的 创建 方式 


核心 文件 包含 程序 朋 尝 时 对 程序 状态 的 详细 摘 述 : 栈 的 内 容 〈 或 者 ， 如 果 程 序 是 多 线程 的 ， 
则 是 各 个 线程 的 乒 )，CPU 寄 存 器 的 内 容 《〈 同 样 ， 如 果 程 序 是 多 线程 的 ， 则 是 每 个 线程 上 的 一 组 
寄存 吉 值 )， 程 序 的 静态 分 配 变 量 的 值 〈 全 局 与 static 变 量 )， 等 等 。 

创建 核心 文件 非常 容易 。 下 和 面 是 生成 这 样 文件 的 代码 清单 4-1。 


代码 清单 4-1  abort.c 


int main(void) 
abort(); 












































return 0; 


j 


abort() 函 数 导 至 当前 进程 接收 sIGABRT 信 号 ，SIGABRT 的 默认 信号 处 理 程 序 终 止 程序 并 转 储 
核心 。 代 码 清单 4-2 是 男 一 个 转 储 核心 的 简短 程序 。 在 这 个 程序 中 ， 我们 故意 解除 对 NULL 指 针 的 
引用 。 


代码 清单 4-2  sigsegv.c 


int main(void) 

{ 
char *c = 0; 
printf("%s\n", *c); 








return 0; 


} 
让 我 们 生成 一 个 核心 文件 。 编 详 并 运行 sigsegvc。 


$ gcc -g -W -Wall sigsegv.c -0 sigsegv 
$ ./sigsegv 
Segmentation fault (core dumped) 


如 果 列 出 当前 目录 ， 将 注意 到 一 个 名 为 core〈 或 者 其 变 体 ) 的 新 文件 。 当 在 文件 系统 中 的 某 
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处 看 到 一 个 核心 文件 时 ， 可 能 不 能 立即 分 辨 出 是 哪个 程序 生成 它 鸭 。Unix 命 令 file 有 助 于 指出 转 
储 这 个 特定 核心 文件 的 可 执行 文件 的 名 称 。 
$ file core 


core: ELF 32-bit LSB core file Intel 80386, version 1 (SYSV), SVR4-style, 
SVR4-style, from 'sigsegv' 


核心 文件 命名 约定 
过 去 ， 核 心 文件 的 命名 约定 比较 简单 : 它们 都 称 为 core。 
后 来 ， 在 GNU/Linux 下 ， 多 线程 程序 开始 用 core.3928 这 样 的 文件 名 来 转 储 核心 ， 其 中 数字 
部 分 表示 转 储 核心 的 进程 ID。 
从 Linux 2.5 内 核 起 , 可 以 使 用 /proc/sys/kernel/ 接 口 控制 核心 文件 的 名 称 . 这 个 机 制 很 简单 ， 
完好 地 用 文档 记录 在 Linux 内 核 源 树 下 的 Documentation/sysctl/kernel.txt 中 ，。 


4.2.2 ”有 东 些 shell 可 能 禁止 创建 核心 文件 

很 多 情况 下 ， 调 试 过 程 都 不 涉及 核心 文件 。 如 果 程 序 发 生 了 段 错误 ， 程 序 员 只 要 打开 调试 器 ， 
比如 GDB， 并 再 次 运行 程序 就 可 以 重建 该 错误 。 由 于 这 个 原因 ， 而 且 因 为 核心 文件 可 能 比较 大 ， 
所 以 大 多 数 现代 shell 都 会 在 一 开始 束 防 止 编写 核心 文件 。 

在 bash 中 ， 可 以 使 用 ulimit 命 令 控制 核心 文件 的 创建 。 


ulimit -c n 


其 中 n 是 核心 文件 的 最 大 大 小 ， 以 干 学 市 为 持 位 。 超 过 nKB 的 任何 核心 文件 都 不 会 被 编写 。 如 果 
没有 指定 nr，shell 就 会 显示 核心 文件 上 的 当前 限制 。 如 采 人 允许 任意 大 小 的 核心 文件 ， 可 以 使 用 : 


ulimit -c unlimited 


对 于 tcsh 和 和 csh 用户 ，1imit 命 令 控制 核心 文件 大 小 。 例 如 ， 
































limit coredumpsize 1000000 


告诉 shell， 如 果 核 心 文件 大 小 大 于 1 000 000 字 节 ， 则 不 创建 该 文件 。 

如 果 在 运行 sigsegv 后 没有 得 到 核心 文件 ， 对 于 bash 使 用 ulimit -c 检 查 当 前 核心 文件 的 限制 ， 
对 于 tcsh 或 csh 则 使 用 1imit -c 检 查 。 

为 什么 需要 首先 有 核心 文件 呢 ? 既然 可 以 简单 地 在 GDB 中 重 狐 运行 具有 段 错误 的 程序 , 并 重 
建 段 错误 ， 为 什么 要 那么 腑 烦 地 创建 核心 文件 呢 ? 答 案 是 在 有 些 情况 下 ， 比 如 在 下 和 面 的 情况 下 ， 
这 种 假设 是 不 成 立 的 。 

a 只 有 在 运行 了 一 段 长 时 间 后 才 发 生 段 错误 ， 所 以 在 调试 喜 中 无 法 重新 创建 该 钳 误 。 

a 程序 的 行为 取决 于 随机 的 环境 事件 ， 因 此 再 次 运行 程序 可 能 不 会 再 现 段 错 误 。 

a 当 新 手 用 户 运 行程 序 时 发 生 的 段 错 误 。 这 里 的 用 户 ， 通 和 不 是 程序 员 〈 也 不 具有 对 源 代 
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人 码 的 访问 权限 )， 不 会 进行 这 种 调试 。 然 而 ， 为 了 检查 和 调试 ， 这 样 的 用 户 可 能 仍然 会 同 
程序 员 发 送 核心 文件 《如 有 果 可 以 创建 这 种 文件 的 话 ) 。 
然而 要 注意 ， 如 宋 程 序 的 源 代 人 码 不 可 用 ,或 者 可 执行 文件 不 是 用 增强 的 符号 表 编 详 的 ， 其 或 
当 我 们 没有 计划 调试 可 执行 文件 ， 核 心 文件 可 能 都 不 会 有 太 大 的 用 处 。 


4.3 扩展 示例 


本 玉 提 供 一 个 调试 段 错误 的 详细 示例 。 

下 面 是 一 些 C 代 人 码 ， 可 能 是 类 似 于 C++ 学 符 串 的 托管 学 符 串 类 型 的 实现 部 分 。 源 文件 cstring.c 
中 包含 的 代码 ， 实 现 一 种 称 为 cstring 的 类 型 ， 然 而 ， 该 代码 充 满 了 或 明 或 暗 的 程序 错误 。 我 们 
的 目标 是 找 出 所 有 这 些 程 序 错误 并 纠正 它们 。 

CSstring 是 如 下 这 种 结构 的 别名 : 包含 指 问 char 字 符 串 的 存储 空间 的 指针 ， 以 及 一 个 字符 串 
长 度 的 变量 。 我 们 实现 了 一 些 适 用 于 处 理 字 符 串 的 实用 函数 。 

O Init_Cstring(): 采用 老式 的 C 字 符 串 作为 一 个 实 参 ， 并 用 筷 来 初始 化 新 CString。 

D Delete CString(): Cstrings 是 在 推 上 分 配 的 ， 当 不 再 需要 时 ， 必 须 释 放 它 们 的 内 存 。 这 

个 函数 负 贡 无 用 单元 收集 。 

O Chomp(): 删除 和 返回 CString 的 最 后 一 个 学 符 。 

QO Append Chars To CString(): 将 C 样 式 的 字符 串 附 加 到 cstring 后 面 。 

最 后 ，main() 是 测试 CString 实现 的 驱动 函数 。 

本 节 的 代码 使 用 了 一 个 极其 有 用 的 库 函 数 snprintf()。 万 一 你 还 没有 遇 到 过 这 个 函数 ， 不 明 
FETA. SM: 它 基 本 上 类 似 于 printf()， 只 是 这 个 函数 将 其 输出 写 到 字符 数组 
中 ， 而 不 是 写 到 stdout 中 。 为 了 帮助 防止 缓冲 区 溢出 《在 任何 复制 以 空 字 符 结 尾 的 字符 串 的 函数 
中 ， 如 条 衬 宇 符 被 留 在 源 字 人 符 串 之 外 没有 复制 ， 则 可 能 发 生 这 种 流出 )，snprintf() 还 可 以 指定 
要 写 的 最 大 学 节 数 量 ， 包 括 拖 尾 的 空 字符 。 

#include <stdio.h> 

#define STRSIZE 22 
























































int main(void) 

{ 
char s1[] = "brake"; 
char *S2 = "breakpoints"; 
char logo[STRSIZE ] ; 


Falc d ee y 


snprintf(logo, STRSIZE, "5c 4s 4d 5s. , 1 , S1, 2*2, S2); 


puts (logo); 
return 0; 
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这 个 程序 会 将 字符 串 “Ibrake 4 breakpoints” (我 揭 碎 了 4 个 断 点 ) 写 到 字符 数组 1ogo 中 ， 谁 
备 打 印 到 一 张 保险 杠 贴纸 上 。 

下 面 是 我 们 的 cstring 的 实现 。 

#include <stdio.h> 


#include <stdlib.h> 
#include <string.h> 


typedef struct { 
char *str; 


int len; 

} CString; 

CString «Init CString(char xstr) 

{ 
CString *p = malloc(sizeof(CString)); 
p->len = strlen(str); 
strncpy(p-»str, str, strlen(str) + 1); 
return p; 

} 





void Delete CString(CString xp) 
{ 
free(p); 


free(p-»str); 


// Removes the last character of a CString and returns it. 


// 

char Chomp(CString *cstring) 

1 
char lastchar = *( cstring->str + cstring->len); 
// Shorten the string by one 
*( cstring->str + cstring->len) = '0'; 
cstring->len = strlen( cstring->str ); 
return lastchar; 

} 


// Appends a char * to a CString 
// 
CString *Append Chars To CString(CString *p, char *str) 
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1 
char «newstr = malloc(p-»len + 1); 
p->len = p-»len + strlen(str); 
// Create the new string to replace p->str 
snprintf(newstr, p->len, "%s%s", p-»str, str); 
// Fxee old string and make CString point to the new string 
free(p-»str); 
p-»str - newstr; 
return p; 
} 
int main(void) 
{ 
CString «mystr; 
char c; 
mystr - Init CString("Hello!"); 
printf("Init:\n str: ‘%s' len: %d\n", mystr-»str, mystr-»len); 
= Chomp(mystr); 
printf("Chomp ‘%c':\n str: Xs' len: %d\n", c, mystr-»str, mystr->len); 
mystr - Append Chars To CString(mystr, " world!"); 
printf("Append:\n str: ^Xs' len: %d\n", mystr-»str, mystr->len); 
Delete CString(mystr) ; 
return 0; 
} 


研究 该 代码 并 猜 一 下 输出 应 是 什么 。 然 后 编 详 并 运行 它 。 


$ gcc -g -W -Wall cstring.c -o cstring 
$ ./cstring 
Segmentation fault (core dumped) 


HW I T 我 们 需要 做 的 第 一 件 事 是 找 出 这 个 段 错 误 是 在 何 处 发 生 的 。 然 后 可 以 试看 解释 
Sy fl Za PSAP NY BUEN. 

ERRAZ HE T RERED EE S Milton ti E 2 iE E ARE Pte. 5x 
们 不 同 的 是 , Milton 不 知道 如 何 使 用 GDB, 因此 他 打算 打开 Wordpad, 在 代码 中 到 处 插入 对 printf() 
的 调用 ， 并 重新 编译 程序 ， 试 网 指出 段 错误 在 何 处 发 生 。 让 我 们 看 看 我 们 对 程序 的 调试 是 不 是 比 
Milton 快 。 

Milton 用 Wordpad， 我 们 则 用 GDB 分 析 核 心 文件 。 




















$ gdb cstring core 
Core was generated by "cstring'. 
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Program terminated with signal 11, Segmentation fault. 
#0 0x400a9295 in strncpy () from /lib/tls/libc.so.6 


(gdb) backtrace 


#0 0x400a9295 in strncpy () from /lib/tls/libc.so.6 
#1 Ox080484df in Init CString (str=0x80487c5 "Hello!") at cstring.c:15 
#2  0x080485e4 in main () at cstring.c:62 


根据 回 蛮 输出 ， 段 钳 误 发 生 在 第 1$ 行 的 Init_ CSstring() 中 ， 是 在 调用 strncpy() 期 间 发 生 的 。 
甚至 不 需要 仔细 和 碍 看 代码 ， 我 们 已 经 知道 很 可 能 我 们 在 第 1$ 行 上 辐 strncpy() 传 递 了 一 个 NULL 指 
针 。 

这 时 ，Milton 仍 然 在 犹 驳 应 该 在 何 处 插入 第 一 个 对 printf() 的 调用 呢 。 
4.3.1 第 一 个 程序 错误 

GDB 指 出 , 段 错 误 发 生 在 第 1$ 行 的 Init_CSstring() 中 , 因此 将 当前 帧 改 为 调用 Init CString() 
的 那 一 帧 。 

(gdb) frame 1 


#1 Ox080484df in Init CString (str-0x80487c5 "Hello!") at cstring.c:15 
15 strncpy(p-»str, str, strlen(str) + 1); 


我 们 将 这 样 应 用 确认 原则 : 通过 查看 传递 给 strncpy() 的 各 个 指针 参数 ( 即 str、p 和 p->str)， 
依次 确认 它们 的 值 与 我 们 预想 的 一 样 。 首 先 输出 str 的 值 : 


(gdb) print str 
$1 - 0x80487c5 "Hello!" 


由 于 str 是 指针 ， 因 此 GDB 给 我 们 的 值 是 十 六 进 制 地 址 ex8e487c5。 由 于 str 是 char 的 指针 ， 
因此 是 字符 串 的 地 址 ，GDB 很 够 朋友 地 告诉 我 们 字符 串 的 值 :“Hello!” 虽 然 从 上 面 的 回溯 输出 中 
可 以 看 到 这 是 很 明显 的 ， 但 是 我 们 无 论 如 何 应 检 三 一 下 。 因 此 ，str 不 是 NULL， 它 指 癌 一 个 有 效 
FHF, BA BALE HEK o 

现在 让 我 们 将 注意 力 转移 到 其 他 指针 参数 ，p 和 p->str。 

(gdb) print *p 

$2 = { 

str = 0x0, 
len = 6 
} 


问题 现在 很 明显 : p->str, 它 也 是 指 问 字符 串 的 指针 ， 是 NULL。 所 以 段 错误 的 原因 就 出 来 了 : 
我 们 试图 写 入 到 内 存 中 的 位 置 0， 而 这 个 位 置 对 于 我 们 是 禁区 。 
但 是 什么 能 导致 p->str〈 该 结构 下 Cstring 中 的 字符 串 指针 ) 为 NULL? 再 看 看 代码 。 
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(gdb) list Init CString 


5 typedef struct { 

6 char xstr; 

了 int len; 

8 j CString; 

g 

10 

11 CString «Init CString(char xstr) 

12 1 

13 CString «p - malloc(sizeof(CString)); 
14 p-»len - strlen(str); 

15 strncpy(p-»str, str, strlen(str) + 1); 
16 return p; 

17 Í 

18 











我 们 看 到 在 发 生 段 错误 的 代码 行 前 面具 有 两 行 代码 , 它们 之 间 的 第 13 行 很 可 能 十 问题 根源 所 











我 们 将 从 GDB 中 重新 运行 程序 ,在 进入 Init_CSstring() 的 入 口 处 设置 一 个 临时 断 点 ， 并 逐 行 


单 步调 试 这 个 函数 ， 奉 看 p->str 的 值 。 


(gdb) tbreak Init CString 
Breakpoint 1 at Ox804849b: file cstring.c, line 13. 
(gdb) run 


Breakpoint 1, Init CString (str-0x80487c5 "Hello!") at cstring.c:13 


13 CString «p = malloc(sizeof(CString)); 
(gdb) step 

14 p-»len - strlen(str); 

(gdb) print p-»str 

$4 - OxO 

(gdb) step 

15 strncpy(p-»str, str, strlen(str) + 1); 








问题 在 这 里 :; 我 们 打算 提交 一 个 段 错误 ， 因 为 下 一 行 代码 解除 对 p->str 的 引用 ，p->str 仍 然 


为 NULL。 现 在 我 们 使 用 小 灰 单 元 格 来 判断 肥 生 了 什么 。 


当 为 p 分 配 内 存 时 ， 我 们 获得 了 存放 struct 的 足够 内 存 : 一 个 存放 字符 串 地 址 的 指针 ， 以 及 














一 个 存放 字符 串 长 度 的 int 变 量 。 但 是 我 们 没有 分 配 存 放 字 符 串 本 身 的 内 存 。 我 们 犯 了 个 种 见 的 
Hye: 声明 了 指针 ， 却 没有 声明 将 指针 指向 任何 对 象 ! 我 们 需要 做 的 事 首先 是 分 配 足够 的 内 存 来 
存放 str， 然 后 使 p->str 指 癌 刚 刚 分 配 的 内 存 。 下 面 是 这 件 事 的 做 法 《我 们 需要 在 字符 串 的 长 度 
上 加 1， 因 为 strlen() 没 有 将 末尾 的 '\@' 统 计 在 内 )。 











CString «Init CString(char *str) 
i 
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// Allocate for the struct 
CString «p - malloc(sizeof(CString)); 
p-»len - strlen(str); 


// Allocate for the string 

p->str = malloc(p-»len + 1); 
strncpy(p->str, str, strlen(str) + 1); 
return p; 


j 


IE DE— F, Milton WIEST A printf() va FADER Rr. ENRE mE. "UE 
ISA tA, WES ACHE AAR RE ST BR. WRAAE, TASA SUIS S printf () iii. 
4.3.2 ”在 调试 会 话 期 间 不 要 退出 GDB 

在 调试 会 话 期 间 ， 修 改 代码 时 永远 不 要 退出 GDB。 前 面 说 过 ， 这 样 就 不 必 费 时 间 来 启动 ， 可 
以 保留 我 们 的 断 点 ， 等 等 。 

类 似 地 ， 我 们 要 保持 文本 编辑 器 打开 。 在 调试 时 的 两 次 编译 之 间 留 在 同一 个 编辑 器 会 话 中 ， 
我 们 可 以 充分 利用 编辑 嚣 的“ 撤销” 功能。 例如， 调试 过 程 中 的 一 个 常见 策略 是 临时 删除 部 分 代 
但 ， 以 便 集 中 精力 研究 你 认为 存在 错误 的 余下 部 分 。 完 成 检查 后 ， 只 要 使 用 编辑 器 的 撤销 功能 恢 
复 被 删除 的 代码 行 即 可 。 

因此 ， 在 屏幕 上 我 们 通常 有 一 个 GDB (或 DDD) 窗口 ， 以 及 一 个 编辑 器 窗口 。 我 们 还 打开 
了 第 三 个 窗口 用 于 执行 编译 器 命令 ， 甚 至 最 好 是 通过 编辑 器 执行 命令 。 例 如 ， 如 果 使 用 的 是 Vim 
编辑 器 ， 可 以 执行 如 下 命令 ， 它 会 保存 所 做 的 编辑 修改 ， 并 在 同时 重新 编译 程序 。 























: make 


(我们 还 假定 在 Vim 局 动 文 件 中 使 用 set autowritei íi J VimMJautowritee =. WRA, 
Vim 的 功能 也 会 将 光标 移 到 报告 的 第 一 个 编译 警告 或 错误 处 ， 可 以 通过 Vim 的 :cnext 和 :cprev 命 
令 在 多 个 编译 错误 中 来 回调 试 。 当 然 ， 如 果 使 用 这 些 命令 的 简短 别名 放 到 Vim 局 动 文件 中 ， 所 有 
这 些 操作 将 更 方便 。) 

4.3.3 ”第 二 个 和 第 三 个 程序 错误 

当 修 复 了 第 一 个 程序 错误 后 ， 再 次 从 GDB 中 运行 程序 。《〈 记 住 ， 当 GDB 注 意 到 重新 编译 了 
程序 后 ， 它 会 目 动 加 载 新 的 可 执行 文件 ， 因 此 同样 不 需要 退出 和 重 局 GDB。) 

(gdb) run 

The program being debugged has been started already. 


Start it from the beginning? (y or n) y 
"cstring' has changed; re-reading symbols. 























Starting program: cstring 


Init: 
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str: Hello!' len: 6 
Chomp '': 
str: Hello!O' len: 7 
Append: 
str: 'Hello!O world' len: 14 


Program exited normally. 
(gdb) 


Chomp() 中 似乎 有 两 个 问题 。 第 一 ， 它 应 加 上 一 个 感叹 号 '!1'， 但 是 看 上 去 它 加 上 的 是 非 打 印 
字符 。 第 二 ，0 字 符 出 现在 我 们 的 学 符 串 来 尾 。 由 于 Chomp() 是 查找 这 些 程序 错误 的 明显 地 方 ， 因 
此 我 们 将 局 动 该 程序 ， 并 在 Chomp() 的 入 口 处 放置 一 个 临时 断 点 。 

(gdb) tbreak Chomp 

Breakpoint 2 at 0x8048523: file cstring.c, line 32. 


(gdb) run 
Starting program: cstring 











Init: 
str: "Hello!' len: 6 


Breakpoint 1, Chomp (cstring-0x804a008) at cstring.c:32 
32 char lastchar = *( cstring->str + cstring-»len); 


(gdb) 

该 字符 串 的 最 后 一 个 字符 应 该 是 '! 。 让 我 们 确认 一 下 。 

(gdb) print lastchar 

$1 = 0 '\0' 

BTU lastcharze'!', (AS bee PAF. A EKA REET “A” (offby 
one) R.o ERIRE EXA H. a AZU RAS Bs BP SFB o 

pointer offset: 0123456 


cstring->str: Hello! eo 
string length: 123456 


这 个 字符 串 的 最 后 一 个 字符 存储 在 地 址 cstring->str+5 上 ， 但 是 因为 该 字符 串 长 度 是 字符 计 
数 ， 而 不 是 索引 ， 因此 地 址 cstring->str 十 cstring->len 指 回 最 后 一 个 字符 后 面 的 一 个 数组 位 置 ， 
在 这 个 位 置 上 是 以 NULL 结 束 , 而 不 是 我 们 布 望 它 指 问 的 位 置 。 这 个 问题 可 以 修复 , 方法 是 将 如 下 代码 : 









































char lastchar = *( cstring->str + cstring-»len); 


改 为 : 


char lastchar = *( cstring->str + cstring-»len - 1); 
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这 部 分 代码 中 隐藏 了 第 三 个 程序 错误 。 当 调用 chomp() 后 ， 字符 串 “Hello!” 变 成 “Hello!@” 
(不 是 “hello”)。 在 GDB 中 要 执行 的 下 一 行 〈 第 33 行 ) 是 要 缩短 衬 符 串 的 地 方 ， 方 法 是 使 用 结 
尾 的 空 字符 蔡 换 其 最 后 一 个 字符 。 

*( cstring-»str + cstring-»len) = '0'; 

我 们 很 快 发 现 这 一 行 里 包含 了 我 们 刚刚 在 第 31 行 修复 过 的 同样 问题 : 错误 地 引用 了 学 符 串 的 
最 后 一 个 字符 。 而 且 ， 由 于 我 们 的 眼睛 已 经 适应 这 行 代 码 ， 因 此 似乎 我 们 在 该 位 置 人 存储 字符 "8 7， 
它 不 是 空 字 待 。 我 们 的 意思 是 将 '\@' 放 在 字符 串 的 末尾 。 进 行 了 这 两 处 纠正 后 ， 第 33 行 为 : 
































*( cstring-»str + cstring-»len - 1) = '\0'; 

xxr, RH St Miltonfii Hprintf()2€30 STS Behan, FF AMM YEInit CString() F 
纠正 了 内 存 分 配 问 题 。 他 没有 继续 前 进 找到 我 们 刚刚 在 Chomp() 中 修复 的 程序 错误 ， 而 是 不 得 不 
将 所 有 对 printf() 的 调用 部 去 挥 ， 并 重新 编 详 程序 。 他 真 索 ! 
4.3.4 ”第 四 个 程序 错误 

根据 上 一 节 的 讨论 我 们 进行 一 些 纠正 ， 重 新 编 诺 代码， 并 再 次 运行 程序 。 


(gdb) run 
"cstring' has changed; re-reading symbols. 
Starting program: cstring 

















Init: 

str: Hello!' len: 6 
Chomp '!': 

str: Hello' len: 5 
Append: 


str: Hello world' len: 12 
Program received signal SIGSEGV, Segmentation fault. 
Oxb7fo8dai in free () from /lib/tls/libc.so.6 


(gdb) 


XU PA Bet Ye s C Ds BA DO BE T E Jes te 2D c IC ICI, B PEE VH. HI B6 Ee oct 
Append Chars To CString() 中 。 可 以 使 用 一 个 简单 的 backtrace 来 确认 或 否认 这 种 假设 。 

1 (gdb) backtrace 

e #0 Ooxb7f08da1 in free () from /lib/tls/libc.so.6 


s #1 0x0804851a in Delete CString (p=0x804a008) at cstring3.c:24 
4 #2 0x08048691 in main () at cstring3.c:70 


(gdb) 


As da pe y] HI SS — 4T AL, 我 们 的 假设 是 错误 的 : 程序 实际 上 在 Delete CString) P Ji. 
XX JEANS dI ]HEAppend Chars To Cstring(Q) P EB FEX. Ae SEB VATI A Ber 
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关 程 序 错误 在 Delete_CSstring() 中 。 这 正 是 这 里 使 用 GDB 检 得 我 们 预期 的 原因 一 一 完全 省 略 了 奉 
找 在 何 处 发 生 段 错误 的 工作 。 一 旦 我 们 那 位 使 用 printf() 的 朋友 在 调试 时 赶 到 这 里 ,他 一 定 会 将 
追 踩 代码 放 在 错误 的 函数 中 ! 

科 而 ，Delete_CSstring() 较 短 ， 因 此 应 该 能 很 快 发 现 错误 所 在 。 


(gdb) list Delete CString 
20 














21 void Delete CString(CString xp) 
22. 4 

23 free(p); 

24 free(p-»str); 

235 ] 

26 


我 们 首先 释放 p, 然后 释放 p->str。 这 是 一 个 不 太 难 发 现 的 错误 。 当 释放 p 后 , 不 能 保证 p->str 
还 能 指 问 内 存 中 的 正确 位 置 ， 它 可 能 指 癌 任何 位 置 。 当 这 个 “任何 位 置 ” 是 我 们 不 能 访问 的 内 存 
时 ， 就 会 引起 段 错 误 。 修 复方 法 是 逆转 对 free() 的 调用 顺序 。 


void Delete CString(CString *p) 
1 











free(p-»str); 
free(p); 
j 


ME Bk — P. Milton Ze 22 WERE 341 146 2168 EN Chomp () P E fis EP TAY RRE. Ur EAR 
打 电 话 问 我 们 求助 。 
4.8.5 ”第 五 个 和 第 六 个 程序 错误 

我 们 纠正 、 重 新 编 详 ， 并 再 次 运行 代码 。 


(gdb) run 
"cstring' has changed; re-reading symbols. 
Starting program: cstring 








Init: 
str: "Hello!' len: 6 
Ba 
str: Hello' len: 5 
Append: 
str: “Hello world’ len: 12 


Program exited normally. 
(gdb) 
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在 附加 操作 以 后 ， 字 和 人 符 串 中 丢失 了 惊叹 号 ， 本 来 应 当 是 "Hello world!" FAKE, SKET 
符 串 是 错误 的 ， 但 报告 的 字符 串 长 度 12 却 是 正确 的 。 碍 找 这 个 程序 错误 的 最 符合 馆 辑 的 位 置 在 
Append Chars To CString()H, PAI HE AE AS RC 7S BT A o 


(gdb) tbreak Append Chars To CString 

Breakpoint 3 at 0x8048569: file cstring.c, line 45. 
(gdb) run 

Starting program: cstring 


























Init: 

str: ^"Hello!' len: 6 
Chomp '!': 

str: Hello’ len: 5 


Breakpoint 1, Append Chars To CString (p=0x804a008, str=0x8048840 " world!") 


at cstring.c:45 
45 char *newstr = malloc(p-»len + 1); 


C 字 符 串 newstr 震 要 足够 大 ， 以 便 同 时 存放 p->str 和 str。 我 们 看 到 ， 在 第 4$ 行 对 malloc() 
的 调用 没有 分 配 足够 的 内 存 , 它 仅 仅 分 配 了 人 够 放 p->str 和 一 个 结尾 空 字 符 的 空间 。 第 4$ 行 应 改 为 : 





char *newstr = malloc(p-»len + strlen(str) + 1); 


当 进 行 了 这 种 纠正 并 重新 编 详 后 ， 得 到 如 下 输出 。 


(gdb) run 
"cstring' has changed; re-reading symbols. 
Starting program: cstring 


Init: 

str: Hello!' len: 6 
Chomp '!': 

str: Hello' len: 5 
Append: 


str: "Hello world’ len: 12 
xx — AERA TE S Uu eee ie. RRRA EREA “GERI EER” o 
没 错 : 它 确实 是 一 个 程序 错误 ， 它 没有 作为 段 错误 出 现 ， 纯 粹 是 一 种 运气 。 其 余 程 序 错误 很 有 可 
能 仍然 在 Append_Chars_To_CSstring() 中 ， 因 此 我 们 在 那里 设置 另 一 个 断 点 。 























(gdb) tbreak Append Chars To CString 
Breakpoint 4 at 0x8048569: file cstring.c, line 45. 
(gdb) run 


Starting program: cstring 
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(gdb) run 
Init: 

str: Hello!' len: 6 
Chomp '!': 

str: Hello' len: 5 


Breakpoint 1, Append Chars To CString (p=0x804a008, str=0x8048840 " world!") 
at cstring.c:45 


45 char *newstr = malloc(p-»len + strlen(str) + 1); 
(gdb) step 
46 p->len = p-»len + strlen(str); 

















PATER SATAR RPA BAS ER, 字符 串 长 度 却 是 正确 的 : 加 号 正确 地 计算 了 
p->str 与 str 连 接 起 来 的 长 上 度 。 这 里 没有 问题 了 ， 因 此 可 以 继续 下 一 步 。 


(gdb) step 
49 snprintf(newstr, p-»len, "%s%s", p-»str, str); 


下 一 行 代码 (第 49 行 ) 是 我 们 形成 新 字符 串 的 地 方 。 我 们 预期 在 这 一 步 后 newstr 会 包含 "hello 
world!"。 让 我 们 应 用 确认 原则 来 验证 这 一 点 。 

(gdb) step 

51 free(p->str); 


(gdb) print newstr 
$2 = Ox804a028 "Hello world" 


第 51 行 上 代码 构造 的 字符 串 中 缺少 了 恢 叹 号 ， 因 此 程序 错误 可 能 发 生 在 第 49 行 ， 但 会 是 什么 
fate? 在 对 snprintf() 的 调用 中 ， 我们 请 求全 多 将 p->len 子 市 虱 复 制 到 newstr 中 。p->len 的 值 
锌 确认 为 12， 下 一 个 "Hello world! £124 4. RANZA ibsnprintf() REIR TIFE P BA FE 
空 字 符 。 然 而 ， 本 来 以 为 会 得 到 一 个 是 型 字符 串 ， 最 后 一 个 位 置 有 恢 叹 号 ， 没 有 了 和 衬 字 符 ， 但 实 
际 上 并 非 如 此 。 

这 是 snprintf() 的 出 色 之 处 。 它 总 是 将 结尾 空 字符 复制 到 目标 字符 串 中 。 如 条 你 偷懒 ， 指 定 
复制 的 最 多 字符 数 小 于 原 字 符 串 中 实际 学 符 数 (正如 我 们 这 里 所 做 的 )，snprintf() 束 会 复制 它 
能 够 复制 的 尽 可 能 多 的 字符 , 但 写 入 目标 字符 串 的 最 后 一 个 字符 肯定 是 空子 符 。 为 了 修复 我 们 的 
首 误 ， 需 要 让 snprintf() 复 制 是 够 的 子 市 以 存放 源 字 符 串 的 文本 和 结尾 空 字 从。 

因此 需要 修改 第 45 行 。 下 和 耐 是 完整 的 修复 后 函数 。 


CString *Append Chars To CString(CString *p, char *str) 
{ 







































































char *newstr = malloc(p->len + strlen(str) + 1); 
p->len = p-»len + strlen(str); 


// Create the new string to replace p->str 
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snprintf(newstr, p-»len + 1, "%s%s", p->str, str); 
// Free old string and make CString point to the new string 
free(p-»str); 


p-»str - ense 

return p; 
i 
让 我 们 重新 编 详 修复 后 的 代码 ， 并 运行 程序 。 
(gdb) run 


"cstring' has changed; re-reading symbols. 
Starting program: cstring 


Init: 

str: Hello!' len: 6 
Chomp '!': 

str: Hello' len: 5 
Append: 


str: "Hello world!' len: 12 





Program exited normally. 
(gdb) 


看 上 去 不 错 ! 

虽然 我 们 涵盖 了 很 多 领域 ， 并 遇 到 了 一 些 比较 难 的 概念 ， 但 这 是 值得 的 。 即 使 我 们 的 含 程序 
错误 的 CString 实现 有 点 做 作 ， 但 我 们 的 调试 会 话 是 相当 实用 的 ， 包 括 了 调试 的 很 多 方面 : 

O 确认 原则 ; 

O 使 用 核心 文件 进行 衣 演 进程 的 “ 死 后 ”分 析 ; 

a 纠正 、 编 译 并 重新 运行 程序 ， 甚 至 不 需要 退出 GDB; 

O printf() 风 格调 试 的 不 足 之 处 ; 

O 利用 你 的 智慧 ， 这 虽然 原始 ， 却 是 无 可 符 代 的 。 

如 果 你 过 去 是 用 printf() 风 格调 试 的 ， 束 会 及 现 使 用 printf() 跟 踊 某 些 程序 错误 会 有 多 难 。 
虽然 在 调试 中 不 可 避免 地 会 使 用 printf() 诊 断代 码 ， 但 是 作为 一 种 通用 目的 的 “工具 ”， 它 远 远 
不 足以 用 来 跟踪 实际 代码 中 发 生 的 大 部 分 程序 错误 。 
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多 活动 上 下 文中 的 调试 











* H 试 本 来 束 不 是 件 容易 事 ， 当 有 问题 的 应 用 程序 试图 协调 多 个 同步 活动 时 ， 调 试 束 更 加 

yu 共有 挑战 性 。 和 客户 /服务 器 网 络 编程 、 多 线程 编程 ， 以 及 并 行 处 理 ， 都 属于 这 种 情况 。 
本 章 将 概述 最 常用 的 多 路 编程 技术 ， 并 提供 一 些 方法 和 技巧 处 理 这 些 类 型 的 程序 中 的 错误 ， 着重 
介绍 调试 过 程 中 GDB/DDD/Eclipse 的 用 法 。 


5.1 调试 客户/ 服务 器 网 络 程序 


计算 机 网 络 是 极其 复杂 的 系统 , 网 络 化 软件 应 用 程序 的 精确 调试 有 时 需要 使 用 便 件 监控 来 收 
集 关 于 网 络 通信 量 的 详细 信息 。 单 就 这 种 调试 主题 ， 就 足以 写 一 本 书 。 我 们 这 里 的 目标 只 是 简单 
地 介绍 一 下 这 一 主题 。 

我 们 的 示例 由 下 面 的 客户 /服务 器 对 组 成 。 用 户 可 以 通过 客户 机 应 用 程序 检查 运行 服务 器 应 
用 程序 机 圳 上 的 负 和 合 ,， 即 使 用 户 没 有 服务 器 所 在 机 器 的 账户 也 可 以 。 客 己 机 通过 网 络 连接 加 服务 
俐 及 人 会 询 信 息 的 请 求 (这 里 是 通过 Unix 的 w 命 令 伍 询 服务 帮 所 在 系统 上 的 负面)。 然后 服务 右 处 
理 该 请 求 并 返回 结果 ， 捕 获 w 的 输出 ， 并 将 它 通过 网 络 连 接 发 送 回 客户 机 。 一 般 来 说 ， 一 个 服务 
俐 可 以 接受 来 日 多 个 远程 客户 机 的 请 求 ， 为 了 让 示例 人 简单 一 点 ， 我 们 假设 只 有 一 个 客户 机 。 

服务 器 的 代码 如 下 所 示 。 


// SIVI.C 





















































] 
3  // a server to remotely run the w command 
+ // user can check load on machine without login privileges 


if usage: SVI 


#include <sys/types.h> 


{ 
;  #include <stdio.h> 
8 
, #include <sys/socket.h> 


27 2 aM 


1 finclude «netinet/in.h» 
n #include «netdb.h» 

w #include «fcntl.h» 

13 #include <string.h> 
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1u  #include <unistd.h> 
is #include <stdlib.h> 


17 #define WPORT 2000 
is #define BUFSIZE 1000 // assumed sufficient here 


s; int clntdesc, // socket descriptor for individual client 
21 svrdesc; // general socket descriptor for server 


23 Char outbuf[BUFSIZE]; // messages to client 


s void respond() 
了 ant fd nh: 


26 [ ie 

27 

o8 memset(outbuf,O,sizeof(outbuf));  // clear buffer 

99 system("w > tmp.client"); // run 'w' and save results 
30 fd = open("tmp.client",O RDONLY) ; 

3] nb = read(fd,outbuf,BUFSIZE); // read the entire file 
32 write(clntdesc,outbuf,nb);  // write it to the client 

33 unlink("tmp.client");  // remove the file 

34 close(clntdesc); 

s Jj 


37 int main() 
ss (1 struct sockaddr in bindinfo; 





40 // create socket to be used to accept connections 
al svrdesc = socket(AF INET,SOCK STREAM, O); 

42 bindinfo.sin family - AF INET; 

43 bindinfo.sin port - WPORT; 

44 bindinfo.sin addr.s addr - INADDR ANY; 

4 bind(svrdesc,(struct sockaddr *) &bindinfo,sizeof(bindinfo)); 
46 

47 // OK, listen in loop for client calls 

48 listen(svrdesc,5); 

49 

50 while (1) { 

51 // wait for a call 

52 clntdesc = accept(svrdesc,0,0); 

53 // process the command 

54 respond(); 

55 } 

m } 

下 面 是 客户 机 的 代码 。 
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1 // clnt.c 


»  // usage: clnt server machine 


s  #include <stdio.h> 

6 #include <sys/types.h> 
; #include «sys/socket.h» 
s #include «netinet/in.h» 
v  #include «netdb.h» 

i0. finclude <string.h> 

u #include <unistd.h> 


is #define WPORT 2000 // server port number 
4 #define BUFSIZE 1000 


is int main(int argc, char **argv) 
5; { int sd,msgsize; 


19 struct sockaddr in addr; 
20 struct hostent xhostptr; 
ə char buf|[BUFSIZE]; 


23 // create socket 

94 sd = socket(AF INET,SOCK STREAM, 0); 
35 addr.sin family - AF INET; 

36 addr.sin port - WPORT; 


27 hostptr - gethostbyname(argv[1]); 

28 memcpy(&addr.sin addr.s addr,hostptr->h addr list[0],hostptr->h length); 
3€ 

30 // OK, now connect 

T connect(sd,(struct sockaddr *) &addr,sizeof(addr)); 


33 // xead and display response 
34 msgsize = read(sd,buf,BUFSIZE); 


ab if (msgsize > 0) 

36 write(1,buf,msgsize); 
37 printf("\n"); 

38 return 0; 

x0 I 


HF AAAS Fe PAR SS REED RTA PEE 

服务 器 代码 的 第 41 行 上 创建 了 一 个 套 接 字 〈socket)， 这 是 一 种 类 似 于 文件 描述 符 的 抽象 ， 正 
如 人 们 使 用 文件 描述 符 在 文件 系统 对 象 上 执行 1O 操 作 一 样 ， 人 们 通过 套 接 字 向 网 络 连接 读 写 信 
恩 。 在 第 45 行 上 ， 套 接 字 与 特定 的 端口 号 绑 定 ， 随 机 地 选择 为 2000 写 端口 。( 像 本 例 这 样 的 用 户 
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级 别 的 应 用 程序 只 能 使 用 1024 以 上 的 端口 号 。) 这 个 数字 标识 了 服务 器 所 在 系统 上 的 “邮箱 ” 客 
户 机 要 让 这 个 特定 应 用 程序 处 理 的 请 求 发 送 到 该 邮箱 。 

在 第 48 行 上， 服务 器 通过 调用 1isten() 来 “开张 营业 ”。 然 后 在 第 52 行 上 通过 调用 accept() 
等 待 客户 机 请 求 进入 。 在 接收 到 一 个 请 求 之 前 ， 该 调用 会 阻塞 。 然 后 它 返 回 一 个 新 的 套 接 字 来 与 
客户 机 通信 。( 当 有 多 个 客户 机 时 ， 原 来 的 套 接 字 继续 接收 新 请 求 ， 甚 至 有 可 能 同时 服务 现 有 请 
求 ， 因 此 需要 单独 的 套 接 字 。 所 以 需要 按 多 线程 风格 实现 服务 器 。 ) 服务 器 使 用 respond() 函 数 处 
理 客户 机 请 求 ， 通 过 本 地 调用 w 命 令 来 将 机 器 负荷 信息 发 送 给 客户 机 ， 并 在 第 32 行 将 结果 写 到 套 
接 字 中 。 

在 第 24 行 上 ， 客 户 机 创建 一 个 套 接 字 ， 然 后 在 第 31 行 使 用 这 个 套 接 字 与 服务 器 的 端口 2000 
连接 。 在 第 34 行 上 ， 读 取 服 务 器 发 送 的 负荷 信息 ， 然 后 显示 输出 。 

客户 机 的 输出 如 下 所 示 。 


$ clnt laura.cs.ucdavis.edu 
13:00:15 up 13 days, 39 min, 7 users, load average: 0.25, 0.13, 0.09 






































USER TY FROM LOGIN@ IDLE JCPU PCPU WHAT 

matloff :0 - 14Jun07 ?xdm? 25:38 0.15s -/bin/tcsh -c / 
matloff pts/1 :0.0 14Jun07 17:34 0.46s 0.46s -csh 

matloff pts/2 :0.0 14Jun07 18:12 0.39s 0.39s -csh 

matloff pts/3 :0.0 14Jun07 58.00s 2.18s 2.01s /usr/bin/mutt 
matloff pts/4 :0,0 14Jun07 0.00s 1.85s 0.00s clnt laura.cs.u 
matloff  pts/5 :0.0 14Jun07 20.00s 1.88s 0.02s script 

matloff  pts/7 2040 19Jun07 4days 22:17 0.16s -csh 














现在 假设 程序 员 忘 记 在 客户 机 代码 中 编写 第 26 行 , 这 一 行 指定 服务 器 的 系统 要 连接 到 的 端口 。 
addr.sin port = WPORT; 


VERAT BUR ADHERE TAS EUER RE SIC ER V e 
客户 机 的 输出 现在 是 : 


$ clnt laura.cs.ucdavis.edu 








$ 


hh PDAS ti TZ th AE AAN fe s EH BC AS n eee PULLS e P JE AS ol 
的 ， 或 者 服务 器 和 客户 机 上 都 有 原因 。 

让 我 们 使 用 GDB 检 碍 一 下 。 首 先 ， 确 认 客 户 机 成 功 地 连接 到 了 服务 左 。 在 调用 connect() 时 
设置 一 个 断 点 ， 并 运行 程序 。 

(gdb) b 31 

Breakpoint 1 at 0x8048502: file clnt.c, line 31. 


(gdb) r laura.cs.ucdavis.edu 
Starting program: /fandrhome/matloff/public html/matloff/public html/Debug 
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Breakpoint 1, main (argc-2, argv-0xbf81a344) at clnt.c:31 
31 connect(sd,(struct sockaddr *) &addr,sizeof(addr)); 


使 用 GDB 执 行 connect()， 并 检查 一 个 错误 条 件 的 返回 值 。 


(gdb) p connect(sd,&addr,sizeof(addr)) 
$1 = -1 


返回 值 芮 的 是 表示 失败 的 代码 -1。 这 是 一 个 重要 线索 。 (当然 ， 这 是 防御 性 编程 的 问题 ， 当 
编写 客户 机 代码 时 ， 会 检 全 connect() 的 返回 值 ， 并 处 理 连接 失败 的 情况 。) 

顺便 说 一 下 ， 注 意 在 手工 执行 对 connect() 的 调用 时 ， 必 须 去 挥 这 种 类 型 强制 转换 ， 如 果 保 
留 了 这 样 的 类 型 强制 转换 ， 将 会 得 到 下 和 面 的 错误 消 轧 。 


(gdb) p connect(sd,(struct sockaddr *) &addr,sizeof(addr)) 
No struct type named sockaddr. 


XXE HT GDBHHEAREIS] PRAHA, 因为 我 们 在 程序 其 他 地 方 没有 使 用 过 这 个 结构 ,所 以 
抛 出 了 这 条 错误 。 

还 要 注意 ， 如 果 GDB 会 话 中 的 connect() 成 功 了 ， 磺 不 能 继续 前 进 并 执行 第 31 行 。 试 图 打开 
已 经 打开 的 套 接 字 是 一 个 错误 。 

刚才 可 以 跳 过 第 31 行 ， 直 接 来 到 第 34 行 。 可 以 使 用 GDB 的 jump 命 令 做 这 件 事 ， 执 行 jump 34, 
但 是 一 般 而 言 应 当 慎 用 这 个 命令 ， 因 为 它 可 能 导致 跳 过 一 些 代 人 码 下 一 步 需 要 的 机 需 指 令 。 因 此 ， 
如 采 连 接 答 试 成 功 ， 最 好 重新 运行 程序 。 

下 和 面 通 过 检查 调用 connect() 时 的 实 参 addr 来 笠 试 跟踪 失败 的 原因 。 

(gdb) p addr 






































connect(3, {sa family-AF INET, sin port-htons(1032), 
sin addr-inet addr("127.0.0.1")), 16) = -1 ECONNREFUSED (Connection refused) 





从 上 面 的 代码 可 以 看 出 ， 值 htons(1632) 指 示 端 口 2032〈 见 下 面 )， 而 不 是 我 们 预期 的 2000。 这 
说 明 有 可 能 错误 地 指定 了 端口 , 或 者 是 根本 未 记 了 指定 端口 。 检 查 一 下 , 很 快 会 发 现 是 后 一 种 情况 。 

再 次 ， 在 源 代码 中 增加 帮助 调试 过 程 的 机 制 (比如 检查 系统 调用 的 返回 值 ) 时 要 谨慎 。 男 一 
个 有 用 的 步 又 是 包括 如 下 代码 行 : 

















#include «errno.h» 
在 我 们 的 系统 上 ， 这 行 代码 创建 了 一 个 全 局 变量 errno， 它 的 值 可 能 从 代码 中 或 者 GDB 中 输出 。 


(gdb) p errno 
$1 = 111 
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对 照 文 件 /usr/include/linux/errno.h， 发 现 这 个 错误 人 码 表示“ 连接 被 拒绝 ”和 错误。 

然而 ，errno 库 的 实现 可 能 根据 平台 的 不 同 而 不 同 。 例 如 ， 头 文件 可 能 有 不 同 的 名 称 ， 或 者 
errno 可 能 被 作为 宏 调 用 实现 ， 而 不 是 作为 变量 实现 。 

另 一 个 方法 是 使 用 strace， 跟 踩 程 序 做 过 的 所 有 系统 调用 。 




















$ strace clnt laura.cs 


connect(3, (sa family-AF INET, sin port-htons(1032), 
sin addr-inet addr("127.0.0.1")], 16) = -1 ECONNREFUSED (Connection refused) 








真是 一 举 两 得 。 得 到 的 第 一 个 重要 信息 是 ， 立 即 看 到 有 一 个 ECONNREFUSED 错 误 。 第 二 个 信息 
是 ， 还 看 到 端口 为 htons(1632)， 其 值 是 2032。 通 过 从 GDB 中 执行 类 似 如 下 的 命令 可 以 检查 后 者 
的 值 : 








(gdb) p htons(1032) 





显示 值 为 2032， 显 然 不 是 预期 的 2000。 
在 很 多 情况 下 “无 论 是 否 与 网 络 连 接 )，strace 都 是 检查 系统 调用 结果 的 便捷 工具 。 
再 举 一 例 ， 假 设 不 小 心态 记 了 在 服务 器 代码 中 写 入 客户 机 (第 32 行 )。 








write(clntdesc,outbuf,nb);  // write it to the client 





在 这 种 情况 下 ， 客 户 机 程序 会 挂 起 ， 等 待 没有 得 到 的 响应 。 当 然 ， 在 这 个 简单 示例 中 ， 很 快 
可 以 想到 是 在 服务 器 中 调用 write() 时 出 了 问题 ， 因 为 忘记 了 在 代码 中 写 入 客户 机 。 但 是 在 比较 复 
杂 的 程序 中 ， 原 因 可 能 不 会 这 么 明显 。 在 这 样 的 情况 下 ， 需 要 建立 两 个 同步 GDB 会 话 ， 一 个 用 于 
客户 机 ， 一 个 用 于 服务 器 ， 一 前 一 后 地 单 步调 试 程 序 的 这 两 个 会 话 。 然 后 可 以 发 现 ， 客 户 机 在 连接 
操作 的 某 个 位 置 挂 起 , 等待 服务 器 的 响应 ， 因而 可 以 推断 出 程序 错误 可 能 在 服务 器 中 某 个 位 置 。 然 
后 将 注意 力 集中 在 服务 器 GDB 会 话 上 ， 尝 试 弄 清 楚 它 在 那 时 为 什么 没有 向 客户 机 发 送 响 应 。 

在 真正 复杂 的 网 络 调试 情况 中 ， 可 以 使 用 开源 Ethereal 程 序 跟踪 单个 TCP/IP 分 组 。 
5.2 ”调试 多 线程 代码 

日前 多 线程 编程 变 得 很 流行 。 对 于 Unix， 最 普遍 的 线程 包 是 POSIX 标 准 Pthreads， 因 此 本 节 
将 它 用 于 我 们 的 示例 中 。 其 他 线程 包 的 原理 与 它 相似 。 
5.2.1 ”进程 与 线程 回顾 

现代 操作 系统 使 用 分 时 技术 管理 多 个 运行 程序 ， 对 用 户 来 说 似乎 是 同步 执行 的 。 当 然 ， 如 果 
机 器 上 有 多 个 CPU, 会 有 多 个 程序 真正 同步 运行 。 但 是 为 了 简单 起 见 , 我们 假设 只 有 一 个 处 理 器 ， 
在 这 种 情况 下 同步 只 是 一 种 表面 现象 。 

操作 系统 将 运行 程序 的 每 个 实例 表述 为 进程 (Unix RIB) 或 任务 (Windows 术 语 )。 因 此 ， 
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同时 执行 的 单个 程序 的 多 个 调用 (例如 vi 文本 编辑 器 的 同步 会 话 ) 是 各 日 独立 的 进程 。 在 只 有 一 
个 CPU 的 机 器 上 ， 进 程 必须 “轮换 ”操作 。 为 了 形象 地 说 明 ， 让 我 们 假定 每 个 “周期 ”〈 称 为 时 
HA) AR REA 3028 

当 一 个 进程 运行 了 30 坚 秒 以 后 ， 便 件 计时 吉 发 出 一 个 中 断 ， 导 致 操作 系统 运行 。 我 们 假定 这 
个 进程 被 列 的 进程 抢占 了 时 间 户 。 操 作 系统 保存 被 中 断 进程 的 当前 状态 ， 因 此 以 后 可 以 恢复 其 状 
态 ， 然 后 选择 可 以 得 到 时 间 片 的 下 一 个 进程 。 这 个 过 程 称 为 环境 切换 ， 因 为 CPU 的 执行 环境 从 一 
个 进程 切换 到 另 一 个 进程 。 这 个 循环 无 限 重 复 。 

轮换 状态 可 能 提前 终结 。 例 如 ， 当 进程 需要 执行 输入 /输出 时 ， 最 终 会 调用 操作 系统 中 的 一 
个 执行 低层 硬件 操作 的 函数 ， 比 如 说 调用 C 库 函数 scanf() 会 导致 进行 Unix OS read() 系 统 调用 ， 
它 需 要 与 键盘 驱动 程序 进行 交互 。 这 样 , 进程 将 它 的 轮换 安排 让 给 操作 系统 , 提前 结束 了 轮换 状态 。 

这 种 情况 说 明了 一 个 问题 ， 给 定 进程 时 间 片 的 调度 是 相当 随机 的 。 用 户 思考 然后 按 下 一 个 键 
所 花 的 时 间 也 是 随机 的 ， 因 此 无 法 预测 下 次 时 间 片 何 时 开始 。 而 且 ， 如 条 调试 的 是 多 线程 程序 ， 
则 不 知道 将 要 调度 的 线程 次 序 ， 这 会 使 调试 更 加 困难 。 

更 细致 地 看 : 损 作 系统 中 有 一 个 进程 表 ， 列 出 了 关于 当前 所 有 进程 的 信息 。 一 般 来 说 ， 每 个 
进程 在 进程 表 中 被 标记 为 Run 状 态 或 Sleep 状态 。 让 我 们 来 看 一 个 示例 ， 其 中 一 个 运行 程序 到 达 需 
要 从 键盘 读 取 输入 的 位 置 。 正 如 刚刚 提 到 的 ， 这 种 情况 会 结束 进程 的 轮换 状态 。 因 为 进程 现在 在 
等 待 JO 完 成 ， 所 以 操作 系统 将 其 标记 为 处 于 Sleep 状态 ， 使 它 无 资格 占用 时 间 片 。 因 此 ， 在 Sleep 
状态 意味 看 进程 被 阻塞 ,等待 某 个 事件 的 发 生 。 当 这 个 事件 最 终 发 生 后 ， 操 作 系 统 会 将 它 在 进程 
表 中 的 状态 改 回 到 Run。 

非 VO 事 件 也 可 以 触发 进程 变 成 Sleep 状 态 。 例 如 ， 如 果 一 个 父 进 程 创建 了 一 个 子 进程 ， 并 调 
用 wait()， 那 么 父 进程 会 阻塞 ， 直 到 子 进程 完成 它 的 工作 并 且 结 束 。 同 样 ， 这 件 事 发 生 的 确切 时 
间 是 无 法 预测 的 。 

而 且 ， 在 Run 状 态 中 并 不 表示 进程 实际 在 CPU 上 执行 ， 相反， 这 仅 意 味 着 它 准 备 运 行 ， 即 
有 资格 获得 处 理 堪 的 时 间 上 请。 一 旦 发 生 了 环境 切换 ， 操 作 系 统 驶 根据 进程 表 从 当前 处 于 Run 状 
态 的 进程 中 选择 一 个 进程 占用 CPU 的 一 个 周期 。 操 作 系统 使 用 这 一 调度 过 程 来 选择 新 的 环境 ， 
保证 任何 给 定 进程 都 能 获得 时 间 片 ,因而 最 终 会 完成 , 但 是 不 承诺 它 会 收 到 哪些 时 间 片 。 因此， 
等 竺 的 事件 发 生 后 ， 睡 眠 进程 真正 “ 醒 来 ”的 确切 时 间 是 随机 的 ， 进 程 完成 的 准确 速 靳 也 是 随 
机 的 。 

线程 与 进程 非常 类 似 ,， 只 是 线程 占用 的 内 存 比 进程 少 , 创建 线程 和 在 两 个 线程 之 间 切 换 所 需 
的 时 间 也 较 少 。 事 实 上， 线程 有 时 被 称 为 “ 轻 量 级 ”进程 ， 根 据 线 程 系统 和 运行 时 环境 ， 它 们 长 
至 可 能 被 作为 操作 系统 的 进程 实现 。 像 使 用 进程 完成 工作 的 程序 一 样 ， 多 线程 应 用 程序 一 般 会 执 
行 一 个 main() 过 程 ， 该 过 程 创建 一 个 或 多 个 子 线程 。 父 线程 main() 也 是 线程 。 

进程 和 线程 之 间 的 主要 区 别 是 : 与 进程 一 样 ， 虽然 每 个 线程 有 日 己 的 局 部 变量 , 但 是 多 线程 
环境 中 父 程序 的 全 局 变量 被 所 有 线程 共享 ， 并 作为 在 线程 之 间 通 信 的 主要 方法 。( 虽 然 也 可 以 在 
Unix 进 程 之 间 共 享 全 局 变量 ， 但 是 这 样 做 不 方便 。) 

在 Linux 系 统 上 ， 可 以 通过 运行 命令 ps axH 来 查看 系统 上 当前 的 所 有 进程 和 线程 。 
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虽然 有 非 抢占 线程 系统 ， 但 是 Pthreads 使 用 的 是 抢占 线程 管理 集 略 ， 程 序 中 的 一 个 线程 可 能 
在 任何 时 候 被 为 一 个 线程 中 断 。 因 此 ， 上 面 揪 述 的 进程 在 时 间 共 至 系统 中 的 随机 性 要 系 ， 同样 出 
现在 多 线程 程序 的 行为 中 。 所 以 ， 使 用 Pthreads 开 发 的 应 用 程序 中 有 些 程序 错误 不 太 容易 重 现 。 
5.2.2 基本 示例 

下 面 介绍 一 个 求 素数 的 简单 示例 , 该 程序 使 用 经 典 的 埃 拉 托 色 尼 利 法 。 要 求 2 一 zx 之 间 的 素数 ， 
站 先 列 出 所 有 这 些 数 子 ， 然后 去 挥 所 有 2 的 倍数 ， 再 去 挥 所 有 3 的 倍数 ， 以 此 类 推 。 最 后 剩 下 的 束 

ı // finds the primes between 2 and n; uses the Sieve of Eratosthenes, 

2  // deleting all multiples of 2, all multiples of 3, all multiples of 5, 


s. // etc.; not efficient, e.g. each thread should do deleting for a whole 
+  // block of values of base before going to nextbase for more 














6  // usage: sieve nthreads n 
7  // where nthreads 
o  #include <stdio.h> 
io #include «math.h» 
n #include <pthread.h> 


is #define MAX N 100000000 
11 #define MAX THREADS 100 


à — // shared variables 

ız int nthreads, // number of threads (not counting main()) 

18 n, // upper bound of range in which to find primes 

19 prime[MAX N«1], // in the end, prime[i] = 1 if i prime, else 0 
20 nextbase; // next sieve multiplier to be used 





ə int work[MAX THREADS]; // to measure how much work each thread does, 
23 // in terms of number of sieve multipliers checked 


ə  // lock index for the shared variable nextbase 
2 pthread mutex t nextbaselock = PTHREAD MUTEX INITIALIZER; 


v8 — // ID structs for the threads 
ə pthread t id[MAX THREADS]; 


si // "crosses out" all multiples of k, from k*k on 


s void crossout(int k) 

33 { int 1 

34 

2 for (i = k; itk <= n; i++) { 
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prime[ixk] = 0; 


// worker thread routine 
void xworker(int tn) // tn is the thread number (0,1,...) 


int lim, base; 


// no need to check multipliers bigger than sqrt(n) 
lim = sqrt(n); 


do { 
// get next sieve multiplier, avoiding duplication across threads 
pthread mutex lock (&nextbaselock); 
base = nextbase += 2; 
pthread mutex unlock(&nextbaselock); 
if (base <= lim) { 
work[tn]++;  // log work done by this thread 
// don't bother with crossing out if base is known to be 
// composite 
if (prime[base]) 
crossout (base) ; 
j 
else return; 
} while (1); 


main(int argc, char **argv) 


int nprimes, // number of primes found 
totwork, // number of base values checked 
1; 

void *p; 


n = atoi(argv[1]); 
nthreads - atoi(argv[2]); 
for (i = 2; i <= n; i++) 
prime[i] = 1; 
ye 


1 
crossout(2 


mt t A D 


nextbase = 1; 
// get threads started 
for (i = 0; i < nthreads; i++) { 
pthread create(&id[i],NULL,(void *) worker, (void *) i); 


// wait for all done 
totwork - 0; 
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82 for (i = 0; i < nthreads; i++) { 

83 pthread join(id[i],8p); 

84 printf("%d values of base done\n",work[i]); 

85 totwork += work[i]; 

86 } 

87 printf("%d total values of base done\n",totwork) ; 
88 

89 // report results 

90 nprimes = 0; 

91 for (i = 2; i <= n; i++) 

92 if (prime[i]) nprimes++; 

93 printf("the number of primes found was %d\n",nprimes) ; 
94 

of 





这 个 程序 中 有 两 个 命令 行 参 数 ， 一 个 参数 用 来 检 但 素数 范围 上 边界 的 n， 另 一 个 参数 是 表示 
要 创建 的 工作 线程 数量 的 nthreads。 

这 里 的 main() 创 建 工 作 线 程 ， 每 个 工作 线程 是 对 冰 数 worker() 的 一 次 调用 。 这 些 工作 线程 共 
圣 3 个 数据 项 :上边 夫 变量 nx， 指定 要 从 2~n 的 冰 围 内 清除 其 倍数 的 下 一 个 数字 的 变量 nextbase， 
以 及 记录 2 一 7 的 范围 内 的 每 个 数字 是 合 被 消除 的 数组 prime[]。 每 次 调用 反复 地 取得 一 个 尚未 处 
理 的 被 乘 数 base， 然 后 消除 2 一 z 泄 围 内 bpase 的 所 有 倍数 。 创 建 了 工作 线程 后 ，main() 融 使 用 
pthread_join() 等 符 所 有 线程 完成 各 目的 工作 ， 然 后 在 统计 留 下 的 系数 的 数量 后 恢复 程序 ， 并 发 
出 报告 。 报 告 中 不 仪 包括 素数 的 数量 ,而且 包括 每 个 工作 线程 完成 了 多 少 工 作 的 信息 。 在 多 人 处理 
器 系统 上 进行 负载 平衡 和 性 能 优化 时 这 种 评估 很 有 用 。 

worker() 的 每 个 实例 通过 执行 如 下 代码 取得 base 的 下 一 个 值 。 

pthread mutex lock(&nextbaselock); 


base = nextbase += 2; 
pthread_mutex_unlock(&nextbaselock) ; 


这 里 更 新 了 全 局 变量 nextbase， 用 它 来 初始 化 worker() 实 例 的 局 部 变量 base 的 值 ， 然后 ， 工 
作 线 程 删 除数 组 prime[] 中 base 的 倍数 。( 注 意 ， 我 们 在 main() 开 头 束 消除 了 2 的 所 有 倍数 ， 因 而 
仅 需 要 考虑 base 的 奇数 值 。) 

工作 线程 知道 要 使 用 的 base 的 值 后 , 束 可 以 从 共 圣 的 数组 prime[] 中 安全 地 删 去 base 的 倍数 ， 
因为 没有 其 他 工作 线程 会 使 用 这 个 base 值 。 然 而 ， 必 须 将 防护 语句 放 在 base 基 于 的 共 至 变量 
nextbase 的 更 新 操作 周围 《第 26 行 )。 记 住 ， 任 何 工 作 线 程 都 会 被 另 一 个 工作 线程 在 不 可 预测 的 
时 间 抢 占 ， 而 抢占 的 工作 线程 会 在 worker() 的 代码 中 不 可 预测 的 位 置 。 特 别 有 是， 可 能 页 巧 在 如 下 
语句 的 中 间 中 上 断 当 前 工作 线程 : 


base = nextbase += 2; 


Tf] BR 7S TAD Fr sl AAT IR SB EY ek E. FERAL P. APA PP AE 
立即 修改 共享 变量 nextbase， 它 可 能 导 和 化 隐伏 且 难 以 重 现 的 程序 错误 。 
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用 防护 语句 将 操作 共享 变量 的 代码 〈( 称 为 关键 部 分 ) 括 起 来 ， 可 以 防止 发 生 这 种 情况 。 对 
pthread_mutex_lock() 和 pthread_mutex_unlock() 的 调用 可 以 确保 基本 只 有 一 个 线程 执行 括 起 
来 的 程序 片段 。 对 这 两 个 函数 的 调用 告诉 操作 系统 ， 只 有 当前 没有 其 他 线程 在 执行 关键 部 分 时 ， 
才 允 许 一 个 线程 进入 这 个 关键 部 分 , 并 且 让 操作 系统 不 要 抢占 该 线程 , 直到 它 完 成 整个 部 分 。( 线 
程 系统 内 部 使 用 锁 变 量 nextbaselock 来 确保 这 种 “ 互 斥 现象 ” ) 

但 是 ， 往 往 太 容易 发 生 这 样 的 情况 : 没有 成 功 地 识别 和 /正确 地 保护 线程 代码 中 的 关键 部 分 。 
让 我 们 看 看 如 何 使 用 GDB 调 试 Pthreads 程 序 中 的 这 种 错误 。 假 设 我 们 和 态 记 包括 下 和 面 这 个 解锁 语句 : 


pthread mutex unlock(&nextbaselock); 


这 样 ， 一 旦 关键 部 分 被 一 个 工作 线程 和 完 进入， 而 男 一 个 工作 线程 在 永久 等 待 锁 被 释放 ， 上 肯定 
会 导致 程序 挂 起 。 但 是 让 我 们 假设 你 不 知道 这 一 点 。 如 何 使 用 GDB 找 出 故障 发 生 的 地 方 呢 ? 

编译 程序 ， 确 保 加 上 了 -1pthread-lm 标 记 ， 以 便 链 接 Pthreads 和 数学 函数 库 〈 调 用 sqrt() 需 
要 后 者 )。 然 后 运行 GDB 中 的 代码 ， 使 n=1686 且 nthreads=2。 

(gdb) r 100 2 

Starting program: /debug/primes 100 2 

[New Thread 16384 (LWP 28653)] 

[New Thread 32769 (LWP 28676)] 

] 


[New Thread 16386 (LWP 28677) 
[New Thread 32771 (LWP 28678) | 


每 次 创建 新 线程 时 ，GDB 孝 会 宣布 一 下 ， 如 上 所 示 。 我 们 很 快 会 市 读者 观察 哪个 线程 在 做 什 




















六 


程序 挂 起 了 ， 通 过 按 下 Ctrl+C 组 合 键 中 断 它 。GDB 会 话 如 下 所 示 。 


(gdb) r 100 2 

Starting program: /debug/primes 100 2 
[New Thread 16384 (LWP 28653)] 

[New Thread 32769 (LWP 28676)] 

[New Thread 16386 (LWP 28677)] 

[New Thread 32771 (LWP 28678)] 


Program received signal SIGINT, Interrupt. 
[Switching to Thread 32771 (LWP 28678)] 
0x4005ba35 in pthread sigsuspend () from /lib/i686/libpthread.so.O 


在 这 种 时 候 ， 关 键 要 知道 每 个 线程 在 做 什么 ， 可 以 通过 GDB 的 info threads 命 令 来 确定 : 


(gdb) info threads 

* 4 Thread 32771 (LWP 28678) 0x4005ba35 in _ pthread sigsuspend () 
from /lib/i686/libpthread.so.O 
3 Thread 16386 (LWP 28677) 0x4005ba35 in pthread sigsuspend () 
from /lib/i686/libpthread.so.O 
2 Thread 32769 (LWP 28676) 0x420db1a7 in poll () from 
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/lib/i686/libc.so.6 
1 Thread 16384 (LWP 28653) 0x4005ba35 in  pthread sigsuspend () 
from /lib/i686/libpthread.so.O 


星 号 表示 当前 在 线程 4 中 。 让 我 们 看 看 那个 线程 是 做 什么 的 。 
(gdb) bt 
HO 0x4005ba35 in pthread sigsuspend () from /lib/i686/libpthread.so.O 
#1 Ox4005adb8 in _ pthread wait for restart signal () 

from /lib/i686/libpthread.so.O 
#2 0x4005d190 in _ pthread alt lock () from /lib/i686/libpthread.so.O 
#3 0x40059d77 in pthread mutex lock () from /lib/i686/libpthread.so.O 
#4 Ox0804855f in worker (tn-1) at Primes.c:49 
H5 0x40059881 in pthread start thread () from /lib/i686/libpthread.so.O 
#6 0x40059985 in pthread start thread event () from 
/lib/1686/libpthread.so.O 


(这 在 Pthreads 的 LinuxThreads 实 现下 是 可 以 做 到 的 ， 但 是 在 其 他 平台 上 不 一 定 起 作用 。) 

从 该 代码 中 看 到 在 帧 3 和 居 4 中 ， 这 个 线程 在 源 代码 的 第 49 行 上 ， 并 且 在 试图 获得 锁 和 进入 天 
键 部 分 。 

pthread mutex lock(&nextbaselock); 


HRE MOH ERREAREN o SER I PU. RAE ACE BUS 
的 情况 并 且 线程 管理 程序 安排 它 获 得 锁 ， 人 否则 这 个 线程 不 会 得 到 任何 时 间 方 。 
其 他 线程 在 做 什么 呢 ? 可 以 通过 切换 到 其 他 任何 线程 然 后 执行 bt 命令 来 检查 该 线程 的 栈 。 


(gdb) thread 3 
[Switching to thread 3 (Thread 16386 (LWP 28677))]#0 0x4005ba35 in 
_ pthread sigsuspend () from /lib/i686/libpthread.so.O0 
(gdb) bt 
HO 0x4005ba35 in _ pthread sigsuspend () from /lib/i686/libpthread.so.O 
#1 Ox400Sadb8 in _ pthread wait for restart signal () 

from /lib/i686/libpthread.so.O 
82 0x4005d190 in pthread alt lock () from /lib/i686/libpthread.so.O 
#3 0x40059d77 in pthread mutex lock () from /lib/i686/libpthread.so.O 
#4 Ox0804855f in worker (tn=0) at Primes.c:49 
#5 0x40059881 in pthread start thread () from /lib/i686/libpthread.so.O 
#6 0x40059985 in pthread start thread event () from 
/lib/ie86/libpthread.so.O 


JA] CUE PAS LTEZRRE. EMANARE tinh PIA, MENRE 
San t AWA UE SES xe —7 LIES EE. IA A SIZE FE3 EVA RAS O3). 

里 然 不 应 有 任何 其 他 工作 线程 , 但 是 调试 的 一 个 基本 原则 是 不 可 以 无 条 件 相 信任 何事 情 , 一 
切 都 必须 检查 。 我 们 现在 通过 检查 其 余 线程 的 状态 来 做 这 件 事 。 你 将 有 发现， 其 他 两 个 线程 现在 是 
非 工 作 线 程 ， 如 下 所 示 。 
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(gdb) thread 2 
[Switching to thread 2 (Thread 32769 (LWP 28676))]#0  Ox420db1a7 in poll 


() 
from /lib/i686/libc.so.6 


(gdb) bt 

#0 Ox420db1a7 in poll () from /lib/i686/libc.so.6 

i1 0x400589de in  pthread manager () from /lib/i686/libpthread.so.O 
#2  0x4005962b in  pthread manager event () from 
/lib/ie686/libpthread.so.O 


因此 线程 2 是 线程 管理 程序 。 它 是 Pthreads 包 的 内 在 线程 。 它 当然 不 是 工作 线程 ， 这 一 点 部 分 
地 确认 了 我 们 对 只 有 两 个 工作 线程 的 预期 。 检 查 线程 1; 

(gdb) thread 1 

[Switching to thread 1 (Thread 16384 (LWP 28653))]#0 0x4005ba35 in 

| pthread sigsuspend () from /lib/i686/libpthread.so.O 

(gdb) bt 

HO 0x4005ba35 in _ pthread sigsuspend () from /lib/i686/libpthread.so.O 

#1 Ox400Sadb8 in pthread wait for restart signal () 

from /lib/i686/libpthread.so.O 

H2  0x40058551 in pthread join () from /lib/i686/libpthread.so.O 

H3  0x080486aa in main (argc-3, argv-Oxbfffe7b4) at Primes.c:83 

H4 0x420158f7 in  libc start main () from /lib/i686/libc.so.6 


发 现 它 是 执行 main() 的 ， 因 此 可 以 确认 只 有 两 个 工作 线程 。 

然而 ， 两 个 工作 线程 都 停止 了 ， 每 个 线程 都 在 等 待 释放 锁 。 难 怪 程 序 挂 起 了 ! 这 样 足以 查 明 
程序 错误 的 位 置 和 性 质 ， 我 们 很 快意 识 到 是 坏 记 了 调用 解锁 函数 。 
5.2.3 BH 

如 果 在 一 开始 没有 意识 到 防护 共享 变量 nextbase 的 必要 性 , 会 发 生 什 么 事情 ? 如 果 在 前 面 的 
示例 中 遗漏 了 解锁 和 加 锁 操 作 ， 会 发 生 什么 情况 ? 

乍 一 看 这 个 问题 ， 可 能 会 以 为 对 程序 的 正确 运行 没有 影响 《〈 即 得 到 精确 的 素数 数量 )， 只 
不 过 可 能 会 由 于 重复 的 工作 而 使 运行 变 悍 〈 即 使 用 base 的 相同 值 多 于 一 次 )。 人 似乎 有 些 线程 会 
重复 其 他 线程 的 工作 ， 如 两 个 工作 线程 恰好 抢夺 nextbase 的 同一 个 值 来 初始 化 它们 的 base 本 地 
副本 。 然 后 ， 有 些 合 数 可 能 最 后 会 被 删 去 两 次 ， 但 是 结果 《〈 即 素数 的 数量 ) 仍然 是 正确 的 。 

但 是 让 我 们 仔细 看 一 下 。 语 名 
































base = nextbase += 2; 
人 至少 编 译 成 两 条 机 器 语言 指令 。 人 例如， 在 运行 Linux 系 统 的 Pentium 机 器 上 使 用 GCC 编译 器 ， 上 面 
的 C 语 句 翻译 成 如 下 汇编 语言 指令 〈 通 过 用 -Ss 选 项 运行 GCC， 然 后 得 看 得 到 的 .文件 来 获得 汇编 


语言 指令 ); 
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addl $2, nextbase 
movl nextbase, “eax 
movl %eax, -8(Xebp) 


VT nextbasevil2, Aja nextbasel] ffi & iil Sg; TESSEAXHH, in. MEEAXIMBE 
制 到 工作 线程 的 栈 中 存储 本 地 变量 base 的 位 置 。 

假设 只 有 两 个 工作 线程 ， 并 用 假设 nextbase 的 值 为 9， 那 么 当前 正在 运行 的 worker() 调 用 的 
IN Ta) Fr EAT A BLAS Ta > n MLB ZW 

addl $2, nextbase 
该 指令 将 共享 全 局 变量 nextbase 设 置 为 11。 假 设 下 一 个 时 间 片 给 予 了 worker() 的 另 一 个 调用 ， 它 
恰好 在 执行 那些 相同 的 指令 。 那 么 第 二 个 工作 线程 现在 将 nextbase 递 增 到 13， 使 用 这 个 信 来 设置 
其 局 部 变量 base, 并 开始 消除 所 有 13 的 倍数 。 最 后 , worker() 的 第 一 个 调用 会 获得 男 一 个 时 间 片 ， 
然后 从 停止 的 地 方 继 续 执 行 机 器 指令 : 


movl nextbase, %eax 
movl %eax, -8(Xebp) 

















当然 ，nextbase 的 值 现在 是 13。 因 此 ， 第 一 个 工作 线程 将 它 的 局 部 变量 base 的 值 设置 为 
13， 并 继续 消除 这 个 值 的 倍数 ， 而 不 是 设置 为 它 在 其 上 一 个 时 间 乒 期 间 设置 的 值 11。 两 个 工 
作 线 程 都 不 会 用 11 的 倍数 做 任何 事 。 最 终 不 仅 量 无 必要 地 重复 了 工作 ， 而 且 忽略 了 必需 的 工 
JE 

如 何 使 用 GDB 发 现 这 样 的 错误 呢 ? 表面 “症状 ”可 能 是 报告 的 又 数 数量 太 大 。 因 此 ， 你 可 
能 猪 测 base 的 值 不 知 何故 有 时 被 跳 过 了 。 为 了 检查 这 一 假设 ， 可 以 在 下 和 面 这 行 代码 后 耐 放置 一 
个 断 点 。 




















base = nextbase += 2; 

通过 重复 执行 GDB 的 continue (c) 命 令 ， 并 显示 base 的 值 ， 

(gdb) disp base 
最 终 可 能 确认 base 的 值 真 的 被 跳 过 了 。 

这 里 的 关键 词 是 “可 能 ” 我 们 前 面 讨 论 过 ， 多 线程 程序 的 运行 有 一 定 的 随机 性 。 在 这 个 例 
子 里 ， 有 可 能 出 现 这 种 情况 : 有 时 运行 程序 后 会 出 现 程 序 错误 〈 即 报告 的 素数 太 多 )， 但 是 有 时 
运行 程序 后 又 可 能 得 到 了 正确 的 答案 ! 

然而 ， 对 这 种 问题 没有 很 好 的 解决 方案 。 调 试 多 线程 代码 第 津 需 要 特别 有 耐心 和 创意 。 
5.2.4 ”GDB 线程 命令 汇总 

下 面 是 与 线程 相关 的 GDB 命 令 用 法 汇总 : 

L] info threads (给 出 天 于 当前 所 有 线程 的 信息 ); 
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Q thread 3 〈 改 成 线程 3 ); 
Q bread 88 thread 3〔 当 线程 3 到 达 源 代码 行 88 时 停止 执行 ); 
O break 88 thread 3 if x==y( 当 线程 3 到 达 产 代码 行 88， 并 有 变量 x 和 ?7 相等 时 停止 执行 )。 


5.25 ”DDD 中 的 线程 命令 


如 图 5-1 所 示 ， 在 DDD 中 选择 Status 一 Threads 会 弹出 一 个 窗口 ， 按 GDB 的 ijnfo threads 方 式 
显示 所 有 线程 。 可 以 单 击 一 个 线程 将 调试 器 的 焦点 切换 到 这 个 线程 上 。 


DDD: /fandrhome/matloff/public html/matloff/public html/Debug/Book/DDD/PrimesThreads.c [ae 


PrimesThreads.c:52 jw © 


3 





j 


// worker thread routine 
void *workerCint tn) ZZ tn is the thread number (0,1,...) 
£ int lim,base; 


// no need to check multipliers bigger than sqrtín) 
lim = sqrt(n); 


t 
// get next sieve multiplier, OM duplication across threa 


thread mutex Lue nl 
ase = nextbas 
DER AAA DER. eben hacselncki: 
if (base <= lim) £ : DDD: Threads 


// composite 
if (prime[base]) [New Thread -1219073120 Q] 
crossout(base); 3 Thread —1219073120 () from libc. so. 6 


了 reac 208583264 i) a WS C252 
else return; 1 Thread -1208579776 () from libc.so.6 
3 while (1); 


mainCint argc, char **argv) 
£ int nprimes, // number of p 
totwork, // number of ba 


void *p; 
[New Thread —1208583264 CLWP 306 
[Switching to Thread —1208583264 


Breakpoint 1, worker (tn-0) at 上 
Cgdb) I 





图 $-1 ”线程 窗口 


最 好 保持 这 个 弹出 窗口 打开 ， 而 不 是 使 用 一 次 束 关 闭 。 这 样 ， 驶 不 必 总 是 在 每 次 要 奉 看 当前 
有 哪些 线程 在 运行 或 者 切换 到 不 同 的 线程 时 都 重新 打开 这 个 窗口 

DDD 中 似乎 没有 办 法 使 上 面 介绍 的 GDB 命 令 break 88 thread à 3 对 特定 线程 WEDA, 
通过 DDD 探 制 台 来 执行 这 样 的 GDB 命 令 。 


5.2.6 Eclipse 中 的 线程 命令 


首先 要 注意 ，Eclipse 创 建 的 默认 make 文 件 不 会 包括 GCC 的 -lpthread 命 令 行 参数 (也 不 包 
括 所 需 的 其 他 任何 特殊 库 的 参数 )。 如 果 你 愿意 ， 可 以 直接 更 改 make 文 件 ， 让 Eclipse 做 这 件 事 
更 容易 。 在 C/C++ 透视 图 中 右 击 项 目 名 ， 单 击 Properties; 选择 C/C++ Build 劳 边 的 三 角形 图 标 ， 
使 其 变 为 下 三 角 ; 选择 Settings 一 Tool Settings; 选择 GCC C Linker 劳 边 的 三 角形 图 标 ， 使 其 成 
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为 下 三 角 ， 再 选择 Libraries 一 Add (后 者 是 绿色 的 加 号 图 标 )， 并 在 -1 后 面 填 上 库 标 志 〈 比 如 ， 
填写 nm 组 成 -Im)。 然 后 构建 项 目 。 

第 1 草 介 绍 过 ，Eclipse 不 断 地 显示 线程 列表 ， 而 不 像 DDD 要 请 求 才 显示 。 而 且 ， 不 需要 像 在 
DDD 中 那样 请 求 回溯 操作 ， 调 用 栈 显示 在 图 $-2 所 示 的 线程 列表 中 。 正 如 上 面 所 介绍 的 ， 我 们 先 
运行 一 会 儿 程序 ， 然 后 单 击 Reswrme 右 边 的 Suspend 图 标 中 断 它 。 线 程 列 表 在 Debug 视 网 中 ,， 它 一 般 
在 屏幕 的 左上 方 , 但 是 这 里 以 展开 的 形式 出 现 , 因为 我 们 单 击 了 Debug 选 项 卡 中 的 Maximize。 (可 
以 单 击 Restore 回 到 标准 布局 。) 











File Edit Navigate Search Run Project Window Help 
g &| & | #- O- Qr | # | Sir Sie © eT o- 


滨 € 趾 E N xo.gs5ÀbÉiov-ag 





三 2 pthread join) 0x47d2d4cb 

= 1 main0 /workspace/primes/PrimePipe.c:83 0x080486db 
D af Thread [2] (Suspended) 
> of Thread [3] (Suspended) 


No source available for" kernel vsyscall) " An outline is not available. 


View Disassembly... 








&|5 Bj) = 日 - roso 





图 $-2 ”Eclipse 中 的 线程 显示 


我 们 发 现 ， 中 断 发 生 时 线程 3 正在 运行 ， 它 收 到 一 个 SIGINT 信 号 ， 这 是 中 断 〈CTRL+C) 信 
号 。 我 们 还 看 到 相关 的 系统 调用 通过 pthread_join() 调 用 ， 而 后 者 由 main() 调 用 。 从 该 程序 以 前 
的 情况 来 看 ， 我 们 知道 它 实 际 上 走 主 线程 。 

要 得 看 妃 一 个 线程 的 信息 , 上 只 要 把 该 线程 劳 边 的 图 标点 成 下 三 角形 即 可 。 要 改 成 万 一 个 线程 ， 
单 击 列表 中 为 一 个 线程 对 应 的 项 。 

我 们 可 能 要 设置 仅 适 用 于 一 个 特定 线程 的 断 点 。 要 做 到 这 一 点 ， 必 须 先 等 到 创建 了 该 线程 。 
然后 ， 当 前 面 设 置 的 断 点 暂停 程序 执行 ， 或 者 出 现 上 面 介 绍 的 中 断 时 ， 我 们 用 创建 断 点 条 件 的 方 
式 右 击 断 点 符号 ， 但 是 这 次 选择 的 是 Filtering。 这 时 会 出 现 一 个 次 似 图 5-3 所 示 的 弹出 窗口 。 我 们 
看 到 ， 这 个 断 点 当前 应 用 于 所 有 3 个 线程 。 例 如 ， 如 采 布 望 这 个 断 点 仅 应 用 于 线程 2， 上 只 要 氮 击 其 
他 两 个 线程 项 劳 边 的 复 选 框 取消 即 可 。 
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Filtering 


Restrict to Selected Targets and Threads: 


Actions 
lc v [2 ý gdb/mi (12/20/07 5:20 PM) (Suspended) 
if Thread [1] (Suspended 
af? Thread [2] (Suspended: Break point hit.) 
af? Thread [3] (Suspended) 











Kl5-3 ”在 Eclipse 中 设置 某 个 线程 特有 的 断 点 


5.3 ”调试 并 行 应 用 程序 

并 行 编 程 染 构 主要 有 两 种 : 共享 内 存 和 消 县 传递 。 

术语 共享 内 存 的 确切 含义 是 : 多 个 CPU 都 共有 对 茶 些 共同 的 物理 内 存 的 访问 权限 。 在 一 个 
CPU 上 运行 的 代码 与 在 其 他 CPU 上 运行 的 代码 通信 ， 方 法 是 通过 在 这 个 共享 内 存 上 恋 写 。 这 与 多 
线程 应 用 程序 中 的 线程 通过 共享 地 址 空间 与 另 一 个 线程 通信 基本 一 样 。( 事 实 上 ， 多 线程 编程 变 
成 了 为 共享 内 存 系统 编写 应 用 程序 代码 的 标准 方式 。) 

相反 ,在 消息 传递 环境 下 ， 在 各 个 CPU 上 运行 的 代码 只 能 访问 该 CPU 的 本 地 内 存 ， 它 通过 通 
信 媒 介 上 发 送 称 为 “消息 ”的 字 节 串 来 与 其 他 CPU 上 的 代码 通信 。 通 常 这 是 某 种 网 络 ， 运 用 某 种 
通用 协议 (比如 TCP/P) 或 者 适用 于 消 奶 传递 应 用 程序 的 专门 软件 基础 结构 。 


5.3.1 idR ARA 


本 节 首 先 以 流行 的 MPI (Message Passing Interface) 包 为 例 ， 讨 论 消息 传 递 。 我 们 这 里 使 用 
的 是 MPICH 实 现 ， 但 是 同样 的 原理 也 适用 于 LAM 和 其 他 MPI 实 现 。 
让 我 们 再 来 看 一 个 求 素 数 的 程序 。 


i #include «mpi.h» 





























// MPI sample program; not intended to be efficient; finds and reports 
4 // the number of primes less than or equal to n 
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53 ”调试 并 行 应 用 程序 


Uses a pipeline approach: node 0 looks at all the odd numbers (i.e., 
we assume multiples of 2 are already filtered out) and filters out 
those that are multiples of 3, passing the rest to node 1; node 1 
filters out the multiples of 5, passing the rest to node 2; node 2 
filters out the rest of the composites and then reports the number 
of primes 


the command-line arguments are n and debugwait 


#define PIPE MSG 0 // type of message containing a number to 


// be checked 


#define END MSG 1 // type of message indicating no more data will 


// be coming 


int nnodes, // number of nodes in computation 


n, // find all primes from 2 to n 
me; // my node number 


E. 
= 
mh fede 


t * 

debugwait; // if 1, then loop around until the 
/ debugger has been attached 

MPI Init(&argc,&argv) ; 

n = atoi(argv[1]); 

debugwait - atoi(argv[2]); 


MPI Comm size(MPI COMM WORLD, &nnodes) ; 
MPI Comm rank(MPI COMM WORLD, &me) ; 


while (debugwait) ; 


void nodeo() 


{ 
L 


int i,dummy, 

tocheck; // current number to check for passing on to next node 
for (i = 1; i <= n/2; i+) { 

tocheck = 2 * i + 1; 

if (tocheck > n) break; 

if (tocheck % 3 > 0) 

MPI Send(&tocheck,1,MPTI INT,1,PIPE MSG,MPI COMM WORLD); 

} 


MPI Send(&dummy,1,MPI INT,1,END MSG,MPI COMM WORLD); 


void node1() 


图 灵 社 区 会 员 cindy282694 GS 尊重 版 权 


137 





138 第 5 章 多 活动 上 下 文中 的 调试 


st { int tocheck, // current number to check from node 0 
52 dummy ; 
53 MPI Status status; // see below 


55 while (1) { 

7 MPI Recv(&tocheck,1,MPI INT,O,MPI ANY TAG, 
57 MPI COMM WORLD, &status); 

58 if (status.MPI TAG -- END MSG) break; 

50 if (tocheck % 5 > 0) 


T MPI Send(&tocheck,1,MPI INT,2,PIPE MSG,MPI COMM WORLD); 


61 } 

m // now send our end-of-data signal, which is conveyed in the 
63 // message type, not the message itself 

64 MPI Send(&dummy,1,MPI INT,2,END MSG,MPI COMM WORLD); 


7 void node2() 

oc { int tocheck, // current number to check from node 1 
69 primecount, 1, iscomposite; 

70 MPI Status status; 


72 primecount = 3; // must account for the primes 2, 3 and 5, which 
75 // won't be detected below 

74 while (1) { 

75 MPI Recv(&tocheck,1,MPI INT,1,MPI ANY TAG, 

76 MPI COMM WORLD, &status); 

7 if (status.MPI TAG -- END MSG) break; 


78 iscomposite - 0; 

79 for (i = 7; ixi <= tocheck; i += 2) 

80 if (tocheck % i == 0) { 

81 iscomposite = 1; 

82 break; 

83 } 

T if (liscomposite) primecount++; 

85 } 

86 printf("number of primes = %d\n",primecount) ; 
v] 


so main(int argc,char *«argv) 
o 1 init(argc,argv); 
7 switch (me) { 


99 case 0:  nodeo(); 
m break; 
of case 1: node1(); 
o5 break; 
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06 Case 2: node2(); 
97 25 
" MPI Finalize(); 





正如 本 程序 开头 的 注释 所 解释 的 ， 这 里 ， 埃 拉 托 色 尼 算法 〈 找 素数 算法 ) 在 并 行 系统 的 3 个 
节点 上 运行 ， 以 多 通道 的 方式 工作 。 第 一 个 节点 从 奇数 开始 ， 去 挥 所 有 3 的 倍数 ， 让 其 余 值 通过 
包 选 ， 第 二 个 节点 获得 第 一 个 节点 的 输出 ， 并 去 反 所 有 5S$ 的 倍数 ， 第 三 个 节点 获得 第 二 个 节点 的 
和 输出， 去 邱 余 下 的 所 有 非 素数 ， 并 报告 剩 下 的 素数 数量 。 

这 里 ， 通 过 让 每 个 证 点 癌 下 一 个 节点 一 次 传递 一 个 数字 来 获得 流水 线 操作 。( 在 各 条 MPI 消 
县 中 传递 成 组 的 数字 因而 减少 通信 开销 ， 效 率 会 高 得 多 。) 当 癌 下 一 个 节点 发 送 数字 时 ， 节 点 发 
运 PIPE_MsG 类 型 的 肖 居 。 当 节点 没有 更 多 数字 要 友 送 时 ， 会 发 送 一 条 END_MsG 类 型 的 消 居 了 予以 
说 明 。 

作为 这 里 的 一 个 调试 示例 ,假设 我 们 愁 记 了 在 第 一 个 节点 中 包括 后 面 的 通知 ， 即 环 记 了 第 46 
行 代码 的 nodee() 。 


MPI Send(&dummy,1,MPI INT,1,END MSG,MPI COMM WORLD); 


该 程序 会 在 “下 游 ” 市 点 处 挂 起 。 让 我 们 看 看 如 何 跟 踊 这 个 程序 错误 。( 记 住 ， 下 和 面 的 GDB 
会 话 中 有 些 行 号 会 与 上 面 的 代码 清单 中 相差 1。) 

在 系统 的 一 个 节点 上 调用 名 为 mpirun 的 脚本 ， 从 而 运行 MPICH 应 用 程序 。 该 脚本 通过 SSH 在 
各 个 节点 局 动 应 用 程序 。 这 里 我 们 在 一 个 有 3 台 机 右 的 网 络 上 做 这 件 事 ,，3 台 机 器 分 别称 为 太 点 0、 
节点 1 和 节点 2, n 等 于 100。 程序 错误 导致 程序 在 后 两 个 节点 处 挂 起 。 程序 也 在 第 一 个 节点 处 挂 起 ， 
因为 只 有 MPI 程 序 的 所 有 实例 都 执行 了 MPI_FINALIZE() 函 数 之 后 ， 才 有 实例 会 退出 。 

虽然 我 们 打算 使 用 GDB, 但 是 因为 在 这 3 个 市 点 上 都 使 用 了 mpirun 来 调用 应 用 程序 ， 而 不 
是 直接 在 节点 上 运行 它们 ， 因 此 我 们 不 能 直接 运 行 GDB。 然 而 ，GDB 人 允许 使 用 进程 号 动态 地 
将 调试 右 附 加 到 已 经 运行 的 进程 上 上。 因此， 让 我 们 在 节点 1 上 运行 ps 来 确定 正在 执行 应 用 程序 
的 进程 。 
















































































$ ps ax 
2755 ? 9 0:00 tcsh -c /home/matloff/primepipe node 1 3 
2776 ? S 0:00 /home/matloff/primepipe nodei 32812 4 
2777 4 S 0:00 /home/matloff/primepipe nodei 32812 4 


MPI 程 序 在 运行 进程 776， 因 此 将 GDB 附 加 到 节点 1 的 程序 上 。 


$ gdb primepipe 2776 
Oxffffeoo2 in ?? () 


该 代码 提供 的 信息 不 是 太 不 理 。 因 此 ， 让 我 们 看 看 现在 位 于 何 处 。 
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(gdb) bt 

#0 Oxffffeoo2 in ?? () 

#1 Ox08074a76 in recv message () 

#2  0x080748ad in p4 recv () 

#3  0x0807ab46 in MPID CH Check incoming () 
#4 0x08076ae9 in MPID RecvComplete () 


HE AvNCNLILEL in MDTR DariNatatunn 6/3 
T 3 VAVOUL FU ol ALE dO TU KEL VE/CI T CI YH X / 


#6 Ox0804a29f in PMPI Recv () 

#7 O0x08049ce8 in nodei () at PrimePipe.c:56 

#8 0x08049e19 in main (argc-8, argv=Oxbffffb24) at PrimePipe.c:94 
#9 0x420156a4 in  libc start main () from /lib/tls/libc.so.6 


MTA Bl Be PP E T8561] Rb ERE, SPEC OR ACT HA o 
fe POR, AIMEE T AI (node1() ETARA Seb THES eA HIN. xe MMT ee, 
还 是 已 经 完成 ?可 以 通过 确定 变量 tocheck 的 上 一 个 已 处 理 的 值 来 衡量 进度 。 


(gdb) frame 7 
#7 Ox08049ce8 in nodei () at PrimePipe.c:56 

















56 MPI Recv(&tocheck,1,MPI INT,O,MPI ANY TAG, 
(gdb) p tocheck 
$1 - 97 


说 明 ”需要 先 使 用 GDB 的 frame 命 令 移动 到 nodel1() 的 栈 帧 ， 











这 段 代 人 码 表明 市 把 1 已 执行 结束 , 因为 97 应 当 是 市 反 0 传 递 给 这 个 节操 进行 素数 检 梧 的 最 后 一 
个 数学 。 因 此 ， 目 前 我 们 料 到 从 节操 0 处 会 产生 一 条 END_MSG 类 型 的 消 且 。 程 序 挂 起 这 一 事实 
蜡 示 了 布 点 0 可 能 没有 发 送 这 样 一 条 消息 ， 而 这 又 导致 我 们 检查 它 是 否 具 有 这 样 的 消息 。 按 这 种 
方式 ， 有 望 很 快 找到 程序 错误 ， 原 来 是 因为 不 小 心 漏 描 了 第 46 行 。 

顺便 说 一 下 ， 当 像 上 面 那样 使 用 如 下 命令 : 

















$ gdb primepipe 2776 


调用 GDB 时 ，GDB 的 命令 行 首 先 检查 名 为 2776 的 核心 文件 。 万 一 存在 这 样 的 文件 ，GDB 会 加 载 
这 个 文件 ， 而 不 是 附加 到 目标 进程 后 面 。 另 外 ，GDB 也 有 attach 命 令 。 

在 本 例 中 , 程序 错误 导致 程序 挂 起 ,调试 像 本 例 这 样 的 并 行程 序 的 方法 与 出 现 错误 输出 征兆 
时 的 方法 略 有 不 同 。 例 如 ,假设 在 第 71 行 错误 地 将 primecount 初 始 化 成 了 2 而 不 是 3。 如 果 试 图 采 
用 相同 的 调试 过 程 ,在 每 个 节点 上 运行 的 程序 就 会 很 快 完成 执行 并 退出 , 而 来 不 及 附加 GDB。( 确 
实 ， 可 以 使 用 非常 大 的 n 值 ， 但 是 通常 一 开始 先 用 简单 的 情况 调试 会 更 好 。) 我 们 需要 某 种 可 用 来 
让 程序 等 待 让 我 们 附加 GDB 的 机 制 ， 而 这 正 是 第 34 行 init() 函 数 的 作用 所 在 。 

正如 在 源 代 人 码 中 看 到 的 ，debugwait 的 值 取 自 用 户 提供 的 命令 行 ，1 表 示 等 待 ，2 表 示 不 等 符 。 
如 果 将 debugwait 的 值 指 定 为 1， 那 么 每 次 调用 程序 时 到 达 第 34 行 ， 它 都 会 在 那里 。 这 样 就 为 我 们 
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提供 了 附加 GDB 的 时 间 。 然 后 可 以 跳出 无 限 循环 ， 并 继续 调试 。 下 和 耐 古 在 市 扩 0 处 所 做 的 。 


node1:~$ gdb primepipe 3124 


0x08049c53 in init (argc-3, argv-Oxbfffe2f4) at PrimePipe.c:34 


34 while Vid it) s 
(gdb) set debugwait - 

(gdb) c 

Continuing. 





我 们 一 般 都 怕 无 限 循 环 ， 但 是 这 里 为 了 便于 调试 ， 却 故意 建立 了 一 个 无 限 循 环 在 太后 1 和 市 
扩 2 处 做 相同 的 事 迟 ， 在 后 一 个 市 态 上 ， 还 在 继续 调试 之 前 利用 了 在 第 77 行 设置 断 点 的 机 会 。 


[matloff@node3 ^|$ gdb primepipe 2944 

34 while (debugwait) ; 

(gdb) b 77 

Breakpoint 1 at 0x8049d7d: file PrimePipe.c, line 77. 
(gdb) set debugwait - 

(gdb) c 

Continuing. 








Breakpoint 1, node2 () at PrimePipe.c:77 





77 if (status.MPI TAG == END MSG) break; 
(gdb) p tocheck 

$1 - 7 

(gdb) n 

78 iscomposite - 0; 

(gdb) n 

79 for (i = 7; i*i <= tocheck; i += 2) 
(gdb) n 

84 if (liscomposite) primecount++; 

(gdb) n 

75 MPI Recv(&tocheck,1,MPI INT,1,MPI ANY TAG, 
(gdb) p primecount 

$2 - 


这 时 ， 注 意 到 primecount 应 为 4， 而 不 是 3 (7 以 下 的 素数 是 2?、3、5 和 7)， 因 此 找到 了 程序 错 
误 的 位 置 。 
5.3.2 ”共享 内 存 系统 

本 廊 介 绍 共 至 内 存 类 型 的 并 行 编程 情形 。 下 和 面 我 们 将 真正 的 共 侍 内 存 机 占 与 软件 分 布 式 共 诗 
内 存 设置 的 情况 分 开 介 绍 。 


1. 真正 的 共享 内 存 
正如 前 面 所 提 到 的 ， 在 真正 的 共享 内 存 环境 中 ， 通 负 使 用 线程 来 开发 应 用 程序 。5.2 节 介绍 
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的 用 GDB/DDD 调 试 的 内 容 丈 派 上 了 用 场 。 

OpenMP 是 这 样 的 机 器 上 流行 的 编程 环境 。OpenMP 问 程序 员 提 供 了 使 用 线程 的 高 级 并 行 编 
程 结 构 。 如 有 必要 ， 程 序 员 仍然 具有 线程 级 的 访问 权限 ， 但 是 在 大 多 数 情况 下 ， 程 序 员 不 需要 了 
解 OpenMP 指 令 的 多 线程 实现 细 市 。 

$.4 节 将 提供 一 个 关于 调试 OpenMP 应 用 程序 的 扩展 示例 。 

2. 软件 分 布 式 共享 内 存 系统 

虽然 双核 CPU 机 器 现 在 普通 消费 者 也 买 得 起 了 , 但 是 具有 多 个 处 理 器 的 大 型 共 孚 内 存 系统 仍然 
要 人 花 几 十 万 美元 才能 买 到 。 一 种 流行 的 、 不 算 太 贯 的 符 代 品 是 工作 站 网 络 Cnetwork of workstations, 
NOW)。NOW 染 构 使 用 了 可 以 造成 共享 内 存 错觉 的 底层 库 。 应 用 程序 员 基 本 上 不 需要 了 解 这 个 
库 ， 它 主要 从 事 维护 不 同 节 点 之 间 共 享 变 量 的 副本 统一 性 这 样 的 网 络 事务 。 

这 种 方法 称 为 软件 分 布 式 共 享 内 存 (SDSM)。 用 得 最 广泛 的 SDSM 库 是 莱 斯 大 学 (Rice 
University) 开发 并 维护 的 Treadmarks。 另 一 个 优秀 的 软件 包 是 JIAJIA,， 可 以 从 何 田 的 站 点 CAttp:// 
www-users.cs.umn.edu/ ^ tianhe/paper/dist.htm) 下 载 。 

SDSM 应 用 程序 展示 的 某 种 行为 会 打击 粗心 的 程序 员 。 它 们 高 度 依赖 于 特定 的 系统 ， 因 此 这 
里 无 法 给 出 通用 的 对 每 方法 ， 但 是 我 们 将 简要 介绍 其 中 的 一 些 共同 问题 。 

很 多 SDSM 是 基于 页 的 ， 这 意味 看 它们 依赖 于 方 点 上 的 抵 层 虚拟 内 存 便 件 。 虽 然 动作 比较 复 
区 ， 但 是 我 们 可 以 给 出 一 个 快速 概览 。 假 设 要 在 NOW 玫 点 之 间 共 享 变量 X。 程 序 员 是 这 样 表达 这 
个 意图 的 : 对 SDSM 库 进行 菜 个 调用 ， 这 个 库 再 发 出 一 个 UNIX 系 统 调 用 ， 请 求 操 作 系 统 对 于 水 
及 包含 X 的 页 错误 ， 使 用 SDSM 库 中 的 函数 蔡 换 它 目 己 的 段 错 误 处 理 程序 。SDSM 的 工作 方式 是 : 
只 有 有 共有 X 的 有 效 副 本 的 NOW 克 点 才 具 有 标记 为 驻 留 的 对 应 内 存 页 。 当 在 其 他 和 点 上 访问 X 时 ， 
束 会 产生 页 错误 ， 确 层 SDSM 软 件 从 拥有 Xx 的 市 点 处 取得 正确 的 值 。 

同样 地 ， 没 有 必要 知道 SDSM 系 统 的 确切 运作 ; 相反 ， 要 知道 有 一 个 底层 的 基于 虚拟 内 存 的 
机 制 ， 在 维护 各 NOW 节 点 的 共 孚 数据 的 本 地 副本 一 致 性 。 如 采 不 了 解 这 一 点 ， 那 么 当 试 图 调试 
SDSM 应 用 程序 代码 时 可 能 会 丈 二 和 尚 挽 不 看 涉 脑 。 调 试 占 可 能 会 由 于 不 存在 的 段 错误 神秘 地 集 
止 ， 因 为 SDSM 基 础 设施 专门 产生 段 错误 ， 当 SDSM 应 用 程序 在 调试 工具 下 运行 时 ， 调 试 工具 能 
感知 它们 。 总 识 到 这 一 点 后 束 根 本 没有 问题 ,在 GDB 中 ， 当 发 生 这 种 奇怪 的 暂 仿 情况 时 ， 只 要 执 
行 continue 命 令 束 可 以 恢复 执行 。 

每 当 友 生 上段 错 误 时 ， 你 可 能 会 试图 使 用 如 下 GDB 命 令 来 命令 GDB 不 要 停止 ,或 让 它 发 出 


ya NE 
= H TH A: 

















































































































handle SIGSEGV nostop noprint 


不 过 , BAITED ACF BY he BCs Pa DB Pe S DEBE] EEE TE Bic 
BR 

然而 ， 针 对 基于 页 的 SDSM 上 运行 调试 程序 时 还 会 出 现 另 一 个 困难 。 如 采 网 络 上 的 一 个 节点 
修改 了 共 衬 变量 的 值 ， 那 么 需要 该 变量 的 其 他 任何 节 氮 都 必须 通过 网 络 事务 获得 更 新 后 的 值 。 再 
次 说 明 ， 这 件 事 的 具体 发 生 方法 取决 于 SDSM 系 统 ， 但 是 这 意味 着 ， 单 步调 试 在 一 个 执行 点 执行 
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代码 时 , 可 能 发 现 GDB 神 秘 地 挂 起 , 因为 节点 正在 等 待 另 一 个 节点 最 近 修 改过 的 变量 的 本 地 副本 。 
如 果 你 健 巧 还 在 运行 一 个 独立 的 GDB 会 话 ， 以 单 步调 试 另 一 个 和 点 上 的 代 但 , 那么 直到 第 二 个 和 
点 上 的 调试 会 话 有 了 足够 的 进度 后 ， 第 一 个 节点 上 才 会 发 生 更 新 。 换 言 之， 如 果 在 SDSM 必 用 程 
序 调试 期 间 程 序 员 不 够 警觉 和 小 心 ， 那 么 他 可 能 由 于 调试 进程 本 喘 使 自己 陷入 死 锁 。 

SDSM 情 况 在 某 种 意义 上 类 似 于 消息 传递 的 情况 : 需要 类 似 上 面 的 MPI 示 例 中 的 debugwait 
变量 。 该 变量 允许 程序 在 所 有 节点 上 暂停 , 给 了 程序 员 在 每 个 节点 上 附加 GDB 并 从 头 开 始 单 步调 
试 程 序 的 机 会 。 

5.4 扩展 示例 

本 节 介 绍 一 个 调试 用 OpenMP 开 发 的 共享 内 存 应 用 程序 的 示例 。 下 面 先 介绍 OpenMP 的 必 有 备 
知识 ， 只 要 对 线程 有 基本 了 解 即 可 。 
5.4.1 OpenMP 要 述 


OpenMP 本 质 上 是 线程 管理 操作 的 高 级 并 行 编程 接口 。 线 程 数量 通过 环境 变量 OMP_NUM_ 
THREADS 设 置 。 例 如 ， 在 C Shell 下 ， 在 shell 提 示 符 下 键入 : 



































% setenv OMP NUM THREADS 4 
可 以 安排 4 个 线程 。 由 C 语 言 组 成 的 应 用 程序 代码 中 散布 痢 OpenMP 指 令 。 每 个 指令 适用 于 该 指令 
后 面 的 块 ， 用 左右 伦 括号 定 界 。 最 基本 的 指令 为 : 

#pragma omp parallel 

这 个 指令 建 并 了 OMP_NUM_THREADS 线 程 ， 每 个 线程 并 友 执 行 pragma 后 和 面 的 代码 块 。 这 个 块 中 
通常 会 租 入 其 他 指令 。 

另 一 个 非常 音 见 的 OpenMP 指 令 是 : 











#pragma omp barrier 





ta tae AE “ee”. FE BREA SIX PAIN SBE, Ee Pe HER 
IX AB FA 
al Ads EB RATER TIT Bo A TEE TER, FY DL 9 73 9H. P AS RS 





#pragma omp single 


JOE AY EUR IRI SE BI 7 BY Bast to 
虽然 有 很 多 其 他 OpenMP 指 令 ， 但 是 本 例 中 使 用 的 为 一 个 指令 是 : 





#pragma omp critical 


顾名思义 ， 该 指令 创建 了 一 个 关键 部 分 ， 其 中 在 任何 给 定时 间 只 允许 一 个 线程 。 
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5.4.2 OpenMP 示 例 程序 

我 们 实现 着 名 的 Dijkstra 算 法 来 确定 加 权 图 中 一 对 顶点 之 间 的 最 小 距离 。 给 出 相 邻 顶点 之 间 
的 距离 《如 果 两 个 顶点 不 相 令 ， 那 么 它们 之 间 的 距离 被 设置 为 无 穷 大 )。 目标 是 求 项 点 0 和 其 他 所 
有 顶点 之 间 的 最 小 距离 。 

下 面 是 源 文件 dijkstra.c。 该 程序 产生 指定 数目 的 顶点 之 间 的 随机 边 长 ， 然 后 求 项 点 0 到 其 他 
各 顶点 之 间 的 最 小 距离 。 


1 // dijkstra.c 











3  // OpenMP example program: Dijkstra shortest-path finder in a 
4  // bidirectional graph; finds the shortest path from vertex 0 to all 
;  // others 


; // usage: dijkstra nv print 


9  // where nv is the size of the graph, and print is 1 if graph and min 
w // distances are to be printed out, 0 otherwise 


2 #include «omp.h» // required 
is finclude <values.h> 


is // including stdlib.h and stdio.h seems to cause a conflict with the 
i // Omni compiler, so declare directly 

5; extern void *malloc(); 

is extern int printf(char *,...); 


x»  // global variables, shared by all threads 


int nv // wnimhar af yvarticac 
He rnv, ff Timber UI VELLI 


29 «notdone, // vertices not checked yet 

25 nth, // number of threads 

94 chunk, // number of vertices handled by each thread 
25 md, // current min over all threads 

2 mv; // vertex which achieves that min 


1 
= 


TT 


xs int *ohd, // 1-hop distances between vertices; "ohd[i][j]" is 
29 i] ohd[ixnv+j | 
30 xmind; // min distances found so far 


s void init(int ac, char **av) 
5 — ( inti,j,tmp; 


T nv - atoi(av[1]); 

35 ohd = malloc(nv«nv«sizeof(int)); 
36 mind = malloc(nv*sizeof(int)); 

87 notdone = malloc(nv*sizeof(int)); 
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// random graph 


for (i = 0; i« nv; itt) 
for (j = i; j < nv; je) { 
if (j == i) ohd[ixnv+i] = 0; 
else { 
ohd[nv*itj] = rand() % 20; 
ohd[nv*jri] = ohd[nv*it+j]; 
} 
} 
i < nv; i++) 1 


// finds closest to 0 among notdone, among s through e; returns min 
// distance in xd, closest vertex in xv 
void findmymin(int s, int e, int *d, int xv) 
L ant xs 

xd = MAXINT; 

for (i = s; i <= e; i++) 

if (notdone[i] && mind[i] < *d) { 
*d = mind[i]; 


kV = 1; 


// for each i in {s,...,e}, ask whether a shorter path to i exists, through 
// mv 
void updatemind(int s, int e) 
( int i; 
for (i = s; i <= ej i++) 
if (notdone[i]) 
if (mind[mv] + ohd[mvxnv+i] < mind[i]) 
mind[i] = mind[mv] + ohd| mvxnv+i]; 


void dowork() 
{ 
#pragma omp parallel 
{ int startv,endv, // start, end vertices for this thread 
step, // whole procedure goes nv steps 
mymv, // vertex which attains that value 
me = omp get thread num(), 
mymd; // min value found by this thread 
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#pragma omp single 
{ nth = omp get num threads(); chunk = nv/nth; 
printf("there are %d threadsWn",nth); } 
startv - me * chunk; 
endv = startv + chunk - 1; 
// the algorithm goes through nv iterations 
for (step = 0; step < nv; step++) { 
// find closest vertex to 0 among notdone; each thread finds 
// closest in its group, then we find overall closest 
#pragma omp single 
{ md = MAXINT; 
mv = Q; 
} 
findmymin(startv,endv,&mymd, &mymv) ; 
// update overall min if mine is smaller 
#pragma omp critical 
{ if (mymd « md) 
{ md = mymd; } 


} 


#pragma omp barrier 

// mark new vertex as done 
#pragma omp single 

{ notdone[mv] = 0; } 

// now update my section of ohd 
updatemind(startv,endv); 


v 


int main(int argc, char **argv) 
{ int i,j,print; 
init (argc, argv); 
// start parallel 
dowork(); 
// back to single thread 
print = atoi(argv[2]); 
if (print) { 
printf("graph weights:\n"); 
for (i = 0; i < nv; i++) { 
for (j = 0; j < nv; j++) 
printf("%u ",ohd[nv*i+j]); 
printf("\n"); 
} 
printf("minimum distances:\n"); 
for (i = 1; i < nv; i++) 
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198 printf("%u\n",mind[i]); 








LEBER PZR CAERE., ARRORA MANR, ZEA Ee “RE” 
集合 中 的 顶点 1~~5。 在 该 算法 的 每 次 迭代 中 ， 进 行 如 下 操作 。 

(1) 沿 者 到 目前 为 止 的 已 知 路 丛 求 得 离 顶 点 0 最 近 的 “未 完成 ”顶点 v。 这 种 检查 被 所 有 线程 
共享 ， 每 个 线程 检查 相等 数量 的 项 点。 完成 这 一 工作 的 函数 是 findmymin()。 

(2) 然后 将 v 移 到 “已 完成 ”集合 。 

(3) 对 于 “未 完成 ”集合 中 余下 的 所 有 顶点 i， 检 查 沿 厦 到 目前 为 止 的 已 知 路 径 先 从 0 到 v， 然 
后 一 下 子 从 v 跳 到 i， 是 否 比 从 0 人 i 的 当前 已 知 最 短 距离 更 短 。 如 果 是 这 样 ， 相 应 地 更 狐 该 距离 。 
执行 这 些 动作 的 函数 是 updatemind() 。 

该 迭代 继续 ， 直 到 “未 完成 ”集合 为 空 。 

由 于 OpenMP 指 令 需 要 预 处 理 ， 因 此 总 是 有 失去 原来 的 行 写 和 变量 及 函数 名 的 潜在 问题 。 为 
了 了 解 如 何 解 决 这 个 问题 ， 我 们 将 讨论 两 个 不 同 编 详 右 的 情况 。 我 们 首先 讨论 Omni 编 详 器 
CAttp://www.hpcc.jp/Omni/) ， 然 后 讨论 GCC (需要 4.2 或 更 狐 的 版 本 )。 

在 Omni 下 对 代码 展开 编 详 : 






































$ omcc -g -o dij dijkstra.c 





当 编 详 该 程序 并 用 4 个 线程 运行 它 以 后 ， 我 们 发 现 它 没有 正确 地 工作 。 


$ dij 61 

there are 4 threads 
graph weights: 

0 3 6 17 15 13 
3 0 15 6 12 9 
6 15 012 7 
17 6 1 0 10 19 
15 12 2 10 0 3 
13 9 7 19 3 0 
minimum distances: 
3 

6 

17 

15 

13 


手工 分 析 这 个 图 可 以 友 现 ， 正 确 的 最 小 距离 应 为 3、6、7、8 和 11。 

然后 ， 我 们 在 GDB 中 运行 程序 。 理 解 OpenMP 通 过 指令 工作 这 一 事实 的 后 果 十 分 重要 。 虽 然 
这 里 讨论 的 两 个 编 详 需 基 本 都 你 留 了 行 号 、 函 数 名 等 ， 但 是 两 者 之 间 仍 然 有 一 坚 关 开 。 当 试图 在 
可 执行 文件 dij 中 设置 断 点 时 ， 看 看 在 我 们 的 GDB 会 话 开端 发 生 了 什么 。 
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(gdb) tb main 

Breakpoint 1 at Ox80492af 

(gdb) r 61 

Starting program: /debug/dij 6 1 

[Thread debugging using libthread db enabled] 
[New Thread -1208490304 (LWP 11580) | 
[Switching to Thread -1208490304 (LWP 11580) | 
Ox080492af in main () 

(gdb) 1 


1 /tmp/omni C 11486.c: No such file or directory. 
in /tmp/omni C 11486.c 





我 们 发 现 断 点 不 在 源 文 件 中 , 而 是 在 Omni 的 OpenMP 基 础 设施 代码 中 。 换 言 之 , 这 里 的 main() 
是 Omni 的 main()， 而 不 是 程序 员 自 己 的 main()。Omni 编 译 器 将 我 们 的 main() 名 称 变 成 了 
 ompc main(). 


为 了 在 main() 上 设置 断 点 ， 键 入 : 








(gdb) tb ompc main 
Breakpoint 2 at 0x80491b3: file dijkstra.c, line 114. 


然后 通过 continuing 来 检查 它 : 


(gdb) c 
Continuing. 
[New Thread -1208493152 (LWP 11614)] 


[Naw Thveoad .2254909230n9 ID 4454651 
| 9 TL CIUI oO UO LLLI lI21vVloJ J 


[New Thread -1229472864 (LWP 11616) ] 
 ompc main (argc-3, argv-Oxbfab6314) at dijkstra.c:114 
114 init(argc,argv); 


这 段 代 人 码 中 有 熟悉 的 init() 人 代码。 当然 ， 可 以 执行 命令 : 

(gdb) b dijkstra.c:114 

注意 3 个 新 线程 的 创建 ， 总 共 是 4 个 线程 。 

然而 ， 我 们 选择 了 设置 断 点 ， 在 这 里 我 们 必须 比 一 般 情况 多 做 一 点 工作 ， 因 此 在 程序 的 两 次 
运行 期 间 停留 在 一 个 GDB 会 话 中 特别 重要 ， 甚 至 当 我 们 修改 了 源 代码 并 重新 编译 时 也 不 要 退出 
GDB 会 话 ， 以 便 保 留 断 点 、 条 件 等 。 如 果 在 这 期 间 关 财 了 GDB 会 话 ， 束 不 得 不 费时 费力 地 重新 


























设置 这 些 内 容 。 

现在 ， 如 何 跟 踩 程序 错误 ? 在 每 次 迭代 结束 时 检查 结果 ， 是 调试 这 个 程序 的 一 种 目 然 方 式 。 
主要 结果 在 “未 完成 ”集合 中 〔( 即 在 数组 notdone[] 中 )〉 ， 以 及 在 从 0 到 其 他 顶点 之 间 的 已 知 距离 
的 当前 列表 中 《〈 即 在 数组 mind[] 中 ) 。 例 如 ， 在 第 一 次 迭代 以 后 ，“ 未 完成 ”集合 应 该 由 顶点 2、 
3、4 和 5 组 成 ， 在 该 欠 代 中 选择 了 顶点 1。 
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有 了 这 些 信息 后 ， 让 我 们 应 用 一 下 确认 原则 ， 并 在 dowork() 中 for 循 环 的 每 次 欠 代 后 检查 
notdone[ ] 和 mind[]。 

必须 评 慎 地 确定 设置 断 点 的 确切 位 置 。 虽 然 第 108 行 算法 的 主 循环 的 末尾 像 是 一 个 很 目 然 的 
位 置 ， 但 是 实际 上 可 能 这 并 不 是 最 佳 位 置 ， 因 为 GDB 针 对 每 个 线程 都 在 那里 停止 。 我 们 应 选择 在 
OpenMP 的 一 个 single 块 内 放置 断 点 ， 这 样 可 以 只 对 于 一 个 线程 停止 。 

因此 ， 我 们 是 从 第 二 次 欠 代 起 在 循环 的 开始 位 置 来 检 答 上 一 次 迭代 的 结 琳 。 

(gdb) b 92 if step »- 1 


Breakpoint 3 at 0x80490e3: file dijkstra.c, line 92. 


(gdb) c 
Continuing. 
there are 4 threads 














Breakpoint 3, — ompc func 0 () at dijkstra.c:93 


93 { md = MAXINT; 

让 我 们 确认 第 一 次 迭代 确实 选择 了 要 移出 “未 完成 ”集合 的 正确 顶点 〈 顶 点 1) 。 
(gdb) p mv 

$1 = 0 


然而 ， 这 个 假设 还 没有 得 到 确认 。 查 看 这 段 代码 可 以 发 现 ， 我 们 在 第 100 行 上 忘记 了 设置 mv。 
我 们 将 它 修改 为 ; 


i md = mymd; mv = mymv; } 


因此 ， 我 们 再 次 重新 编译 和 运行 该 程序 。 正 如 本 节 【〈 以 及 本 书 的 其 他 地 方 ) 前 面 提 到 的 ， 运 
行程 序 时 不 退出 GDB 非 常 有 帮助 。 虽然 可 以 在 男 一 个 终端 窗口 中 运行 该 程序 , 但 是 为 了 有 点 儿 变 
化 ， 让 我 们 在 这 里 采用 另 一 种 不 同 的 方法 。 我 们 通过 执行 dis 命 令 来 暂时 禁用 断 点 ， 然 后 从 GDB 
中 重新 编译 程序 ， 再 使 用 ena 重 新 局 用 呵 点 。 


(gdb) dis 

(gdb) r 

The program being debugged has been started already. 
Start it from the beginning? (y or n) y 

"/debug/dij' has changed; re-reading symbols. 
Starting program: /debug/dij 6 1 

[Thread debugging using libthread db enabled] 

[New Thread -1209026880 (LWP 11712)] 
[ 
[ 











New Thread -1209029728 (LWP 11740)] 
New Thread -1219519584 (LWP 11741)] 
[New Thread -1230009440 (LWP 11742)] 
there are 4 threads 

graph weights: 
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0 3 6 17 15 13 
3 0 15 6 12 9 
6 15 0 12 7 
17 6 1 0 10 19 
15 12 2 10 0 3 
13 9 7 19 3 0 
minimum distances: 


Program exited with code 06. 








(gdb) ena 
得 到 的 仍然 是 错误 的 答案 。 让 我 们 再 次 检 醋 该 断 点 处 的 内 容 。 
(gdb) r 


Starting program: /debug/dij 6 1 

[Thread debugging using libthread db enabled] 
[New Thread -1209014592 (LWP 11744)] 

[New Thread -1209017440 (LWP 11772)] 

[New Thread -1219507296 (LWP 11773)] 

[New Thread -1229997152 (LWP 11774)] 

there are 4 threads 

[Switching to Thread -1209014592 (LWP 11744)] 


Breakpoint 3, — ompc func 0 () at dijkstra.c:93 
93 ( md - MAXINT; 


(gdb) p mv 
$2 = 1 


mv 现在 至 少 有 正确 的 值 。 再 检查 mind[ ] 。 


(gdb) p *mind@6 
$3 8-10, 3; 0, 17, 35, 13] 











注意 ， 因 为 通过 malloc() 动 态 地 构造 了 mind[] 数 组 ， 因 此 不 能 使 用 GDB 的 print 命 令 的 一 般 
形式 。 我 们 使 用 了 GDB 的 人 工 数组 功能 。 

无 论 如 何 ，mind[] 都 是 错误 的 。 例 如 ，mind[3] 应 当 是 3+6=9， 然 而 它 是 17。 让 我 们 检 奏 更 新 
mind[ 的 代码 。 


(gdb) b 107 if me == 1 
Breakpoint 4 at Ox8049176: file dijkstra.c, line 107. 
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(gdb) r 

The program being debugged has been started already. 
Start it from the beginning? (y or n) y 
Starting program: /debug/dij 6 1 

[Thread debugging using libthread db enabled] 
[New Thread -1209039168 (LWP 11779)] 

[New Thread -1209042016 (LWP 11807)] 

[New Thread -1219531872 (LWP 11808)] 

[New Thread -1230021728 (LWP 11809)] 

there are 4 threads 

[Switching to Thread -1230021728 (LWP 11809) | 


Breakpoint 4, — ompc func O () at dijkstra.c:107 
107 updatemind(startv,endv); 


首先 ， 确 认 startv 和 endv 上 只 有 有 意义 的 值 。 


(gdb) p startv 





$4 = 1 
(gdb) p endv 
$5 = 1 





这 个 块 的 大 小 仅 为 1 吗 ? 让 我 们 看 一 下 。 

(gdb) p chunk 

$6 - 1 

“ret 了 chunk 的 计算 结 末 后 ， 我 们 意识 到 需要 等 分 nv 的 线程 数量 。 后 者 的 信 为 6， 它 不 能 被 
我 们 的 线程 数 4 整 除 。 我 们 先 记 下 以 后 要 插入 一 些 错误 捕获 代码 ， 然 后 暂时 将 线程 数 减少 为 3。 

同样 ， 做 这 件 事 时 不 要 退出 GDB 。 虽 然 GDB 继 承 了 首次 调用 时 的 环境 变量 ， 但 是 也 可 以 在 
GDB 中 修改 或 设 普 这 些 变量 的 值 ， 我 们 在 这 里 所 做 的 事 用 如 下 代码 表示 。 


(gdb) set environment OMP NUM THREADS = 3 


























现在 再 次 运行 程序 。 


(gdb) dis 

(gdb) r 

The program being debugged has been started already. 
Start it from the beginning? (y or n) y 

Starting program: /debug/dij 6 1 

[Thread debugging using libthread db enabled] 

[New Thread -1208707392 (LWP 11819)] 

[New Thread -1208710240 (LWP 11847)] 
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[New Thread -1219200096 (LWP 11848)] 
there are 3 threads 

graph weights: 

0 3 6 17 15 13 

3 0 15 6 12 9 

6 15 0 1 2 7 

17 6 1 0 10 19 

15 17 2 10 0 3 

13 9 7 19 3 0 

minimum distances: 


Program exited with code 06. 





(gdb) ena 
唉 ， 得 到 的 仍然 是 错误 的 答案 ! 继续 检查 mind[] 的 更 新 进程 。 
(gdb) r 


Starting program: /debug/dij 6 1 

[Thread debugging using libthread db enabled] 
[New Thread -1208113472 (LWP 11851)] 

[New Thread -1208116320 (LWP 11879)] 

[New Thread -1218606176 (LWP 11880)] 

there are 3 threads 

[Switching to Thread -1218606176 (LWP 11880)] 


Breakpoint 4, — ompc func O () at dijkstra.c:107 
107 updatemind(startv,endv); 

(gdb) p startv 

y 52 

(gdb) p endv 

$8 - 3 


好 了 ， 在 me=1 的 情况 下 ， 得 到 了 startv 和 endv 的 正确 值 。 因 此 ， 进 入 函数 : 


(gdb) s 
[Switching to Thread -1208113472 (LWP 11851)] 


Breakpoint 3, — ompc func 0 () at dijkstra.c:93 


93 { md = MAXINT; 
(gdb) c 
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Continuing. 

[Switching to Thread -1218606176 (LWP 11880)] 
updatemind (s-2, e-3) at dijkstra.c:69 

69 for (i = s; i <= e; i++) 


， 由 于 上 下 文 在 这 些 线程 之 间 切 换 ,， ACR AT Ar BNE Nupdatemind(). 现在 检查 i=3 





(gdb) tb 71 if i -- 
Breakpoint 5 at 0x8048fb2: file dijkstra.c, line 71. 


(gdb) c 

Continuing. 

updatemind (s-2, e-3) at dijkstra.c:71 

74 if (mind[mv] + ohd[mv*nv+i] < mind[i]) 


Be. RIS Jet t] 


(gdb) p mv 
$9 - 0 
^4 —4TUAdH. HUST ZA, FEAR VIER, mv AL. APA RUSSIE OU ? 


回 过 神 来 ， 站 再 看 一 下 上 面 的 GDB 输 出 。 系 统 ID 为 11851 
的 线程 已 经 在 第 93 行 上 ; 换言之 ， 它 已 经 在 该 算法 主 循环 的 下 一 次 友 代 中 。 事 实 上 ， 当 我 们 按 下 
c 来 继续 时 ， 它 甚至 执行 了 第 94 行 ， 即 





该 线程 重 写 了 mv 以 前 的 什 1， 因 此 更 新 mind[3] 的 线程 现在 依赖 于 mv 的 错误 值 。 解 决 方法 是 添 
加 另 一 个 屏障 Carrier) 。 


updatemind(startv, endv) ; 
#pragma omp barrier 








修复 这 个 问题 后 ， 程 序 就 可 以 正确 地 运行 。 

前 述 代码 是 用 Omni 编 译 器 的 。 正 如 我 们 所 提 到 的 ， 从 版 本 4.2 起 ，GCC 也 能 处 理 OpenMP 代 
僻 了 。 只 要 在 GCC 命令 行 上 添加 -fopenmp 标 记 即 可 。 

与 Omni 不 同 的 是 ，GCC 生 成 代码 时 ， 从 一 开始 ，GDB 的 焦点 就 在 你 目 己 的 源 代码 中 。 因 此 ， 
在 GDB 会 话 的 开端 执行 如 下 命令 。 








(gdb) b main 





实际 上 会 叶 仑 在 日 已 的 main() 中 设置 一 个 断 点 ， 这 与 我 们 在 Omni 编 译 占 中 看 到 的 情况 不 同 。 
然而 , 在 编写 本 书 时 ， GCC 的 一 个 主要 缺点 是 : OpenMP parallel 块 内 的 局 部 变量 (OpenMP 
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术语 称 之 为 私有 变量 ) 的 符号 在 GDB 中 不 可 见 。 例 如 ， 对 上 面 Omni 生 成 的 代码 执行 如 下 命令 对 
GCC 生 成 的 代码 也 适用 : 

(gdb) p mv 
但 是 命令 

(gdb) p startv 


则 不 适合 于 GCC 和 后 成 的 代码 。 
当然 ， 这 个 问题 有 解决 的 办 法 。 例 如 ， 要 知道 startv 的 值 ， 可 以 查询 updatemind() 中 s 的 值 。 
但 愿 这 个 问题 在 GCC 的 下 一 个 版 本 中 会 得 到 解决 。 
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1r 调试 过 程 中 会 产生 各 种 调试 工具 没 法 处 理 的 问题 ， 本 章 将 讨论 其 中 的 部 分 问题 。 


6.1 根本 无 法 编译 或 加 载 
尽管 GDB、DDD 和 Eclipse 的 威力 不 小 ， 但 是 如 果 程 序 根 本 不 能 编译 ， 调 试 工具 再 强大 也 无 
可 奈何 。 本 节 介 绍 处 理 这 种 情况 的 一 些 技巧 。 
6.1.1 语法 错误 消息 中 的 “幽灵 ” 行 号 
有 时 编 详 器 指出 第 x 行 有 话 法 错误 ， 而 事实 上 第 x 行 完全 正确 ， 真 正 的 错误 在 表面 某 一 行 上 。 
人 例如， 下面 是 第 3 章 的 源 文件 Diztree.x， 在 还 没有 指出 的 某 个 地 方 抛 出 了 一 个 语法 错误 〈 其 实 
如 果 要 查找 这 个 错误 ， 是 相当 明显 的 )。 


1 // bintree.c: routines to do insert and sorted print of a binary tree 











s #include <stdio.h> 
4  #include <stdlib.h> 


6 struct node { 

7 int val; // stored value 

8 struct node «left;  // ptr to smaller child 
9 struct node «right; // ptr to larger child 


10 rf 





ıı typedef struct node nsp; 
i4 nsp root; 
is nsp makenode(int x) 


T 


18 nsp tmp; 
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20 tmp = (nsp) malloc(sizeof(struct node)); 
91 tmp-»val - x; 
29 tmp-»left = tmp-»right = 0; 
23 return tmp; 
"S 
x void insert(nsp *btp, int x) 
27 f 
98 nsp tmp = *btp; 
: if (*btp == 0) { 
$1 xbtp - makenode(x); 
39 return; 
33 } 
34 
35 while (1) 
36 1 
37 if (x « tmp-»val) { 
38 
90 if (tmp-»left !- 0) ( 
40 tmp = tmp-»left; 
+l } else { 
(2 tmp-»left - makenode(x); 
48 break; 
tl } 
AS 
} else { 
A? 
48 if (tmp-»right != 0) { 
19 tmp = tmp->right; 
50 } else { 
51 tmp->right = makenode(x); 
52 break; 
;3 } 
54 
5 } 
6] 
s Void printtree(nsp bt) 
» 1 
60 if (bt -- 0) return; 
T printtree(bt-»left); 
62 printf ("%d\n" ,bt-»val); 
63 printtree(bt-»right); 
TM 
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os int main(int argc, char xargv[]) 


o (1 

68 int 1; 

o9 

70 root - 0; 

"i for (i = 1; i < argc; i++) 

T insert(&root, atoi(argv[i])); 
73 printtree(root); 

7 )] 


通过 GCC 运行 这 段 代 码 产生 的 结果 为 : 
$ gcc -g bintree.c 


bintree.c: In function "insert': 
bintree.c:75: parse error at end of input 


由 于 第 74 行 是 源 文件 的 末尾 ,因此 第 二 条 错误 消息 至 少 可 以 说 提供 的 信息 量 相当 少 。 但 是 人 第 
一 条 消息 表明 问题 在 insert() 中 ， 因 此 这 是 一 个 线索 ， 尽 管 这 条 消息 没有 指出 问题 是 什么 ， 也 没 
有 指出 问题 在 何 处 。 

在 这 种 情况 下 ， 和 典型 的 出 钳 诛 因 是 少 了 闭合 花 插 号 或 分 号 。 可 以 直接 检 否 有 没有 缺少 这 样 的 
符号 ， 但 是 在 大 文件 中 这 样 做 比较 困难 。 下 面 我 们 采用 另 一 种 方法 。 

第 1 章 介绍 过 确认 原则 。 这 里 ， 先 确认 问题 确实 在 insert() 中 。 要 进行 这 样 的 确认 ， 和 暂时 先 
将 该 函数 从 源 代码 中 注释 挥 。 





























tmp-»val = x; 
tmp->left = tmp-»right = 0; 
return tmp; 


} 


// void insert(nsp *btp, int x) 





// 1 

// nsp tmp - xbtp; 

// 

/7 if (*btp == 0) 1 

// *btp = makenode(x); 

// return; 

// } 

// 

// while (1) 

// { 

// if (x < tmp->val) { 

// 

// if (tmp-»left !- 0) { 
// tmp - tmp-»left; 
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// } else 1 

// tmp-»left = makenode(x); 
// break; 

// } 

// 

// } else { 

// 

jj if (tmp->right != 0) { 

// tmp - tmp-»right; 

"Pi } else 1 

// tmp-»right - makenode(x); 
// break; 

// } 

// 

// } 

// } 


void printtree(nsp bt) 


{ 
if (bt == 0) return; 


说 明 RAE REA ARIE BR, kei KRR., ATE PBA TARA LAR 
辑 器 快捷 方式 。 


保存 文件 ， 然 后 重新 运行 GCC。 


$ gcc -g bintree.c 

/tmp/ccgOLDCS.o: In function ~main': 

/home/matloff/public html/matloff/public html/Debug/Book/DDD/bintree.c:72: 
undefined reference to 'insert' 

collect2: ld returned 1 exit status 


不 要 被 连接 器 LD 关于 找 不 到 insert() 的 抱 候 分 获 注 意 力 。 毕 苋 早 束 知 道 肯 定 会 有 这 样 的 抱 
念 ， 因 为 前 面 已 经 注释 掉 了 该 函数 。 重 要 的 是 已 经 没有 像 以 前 那样 抱 仿 语法 错误 。 因 此 ,确认 了 
语法 错误 在 insert() 中 。 现 在 ， 取 消 该 函数 的 注释 (同样 ， 最 好 使 用 文本 编辑 器 快捷 方式 ， 比 如 
“撤销 ”) 并 保存 文件 。 另 外 ， 为 了 确保 已 正确 地 恢复 ， 重 新 运行 GCC 以 确认 这 一 语法 错误 再 次 出 
现 〈 这 里 不 再 显示 该 错误 )。 

这 时 可 以 应 用 第 1 革 介 绍 的 男 一 个 原则 : 二 分 搜索 原则 。 反 复 缩 小 函数 insert() 中 的 搜索 区 
域 ， 每 次 将 搜索 区 域 切 成 两 半 ， 直 到 获得 足够 小 的 区 域 找 出 语法 错误 。 

为 了 达到 这 个 目的 ， 先 将 该 函数 的 大 约 一 半 内 容 注 释 挥 。 做 这 件 事 的 一 种 合理 方式 是 直接 
将 while 循 环 注释 了 ， 然 后 重新 运行 GCC。 
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$ gcc -g bintree.c 
$ 


这 时 发 现 错误 消息 消失 了 ， 因 此 语法 问题 肯定 在 这 个 循环 中 的 茶 个 地 方 。 那 么 ， 已 将 问题 的 范 
围 崎 小 到 了 该 函数 的 一 半 ， 现 在 继续 将 这 一 区 域 切 成 两 半 。 为 此 ， 将 else 人 代码 也 注 杰 邱 。 

















void insert(nsp xbtp, int x) 





1 
nsp tmp = +*btp; 
if (*btp == 0) { 
*btp = makenode(x); 
return; 
Jj 
while (1) 
i 
if (x « tmp-»val) { 
if (tmp-»left != 0) { 
tmp = tmp-»left; 
} else { 
tmp->left = makenode(x) ; 
break; 
} 
} // else { 
// 
// if (tmp->right != 0) { 
id tmp = tmp->right; 
jj } else { 
// tmp->right = makenode(x); 
// break; 
// } 
// 
// } 
j 








重新 运行 GCC， 发 现 问题 再 次 出 现 : 


$ gcc -g bintree.c 
bintree.c: In function "insert': 
bintree.c:75: parse error at end of input 


Alt, ARRA Ei, BRAEMAR. KN, CA aye BIA NSUY RATT 
ARS AL, BSEC EL call i SE NL GSC n] AEH ad ell: DL EET AN) itl Sb Bai f-then-else 
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HA Aa HET S. 

二 分 搜索 原则 对 于 查找 未 知 位 置 的 语法 错误 非常 有 帮助 。 但 是 在 暂时 注释 掉 代 码 的 过 程 中 ， 
一 定 不 要 造成 新 的 语法 错误 ! 要 像 我 们 这 样 ， 将 整个 函数 、 整 个 循环 一 起 注释 掉 。 
6.1.2 RODE 


AINGCC (SE bn EE ETET EE GCCUSRIBIXEBESSLDO 会 通知 你 无 法 找到 代码 调用 
的 一 个 或 多 个 函数 。 这 通常 是 由 于 没有 成 功 地 将 库 函 数 的 位 置 通知 GCC。 本 书 的 很 多 读者 肯定 都 
精通 这 一 主题 ， 但 是 为 了 照顾 不 精通 这 一 主题 的 读者 ， 我 们 在 本 节 进 行 一 下 简单 的 介绍 。 注 意 ， 
本 市 的 讨论 主要 适用 于 Linux， 它 也 基本 适用 于 其 他 Unix 类 型 的 操作 系统 。 

1. 示例 

让 我 们 使 用 下 面 的 简单 代码 作为 示例 ， 它 包含 ac 中 的 一 个 主 程序 : 

// a.C 






































int f(int x); 


main() 

{ 
int v; 
scanf ("%d" ,&v); 
printf("%d\n", f(v)); 





} 
以 及 z/b.c 中 的 一 个 子 程序 : 
/7 b.c 


int f(int x) 





{ 
return xxx; 
} 
如 条 试 图 在 没有 连接 到 &c 中 的 代码 时 就 编译 wc， 那 么 LD 当 然 会 抱怨 。 
$ gcc -g a.c 


/tmp/ccIP5WHu.o: In function ~main': 
/debug/a.c:9: undefined reference to `f' 
collect2: ld returned 1 exit status 


我 们 可 以 进入 z 中 ， 编 译 b.c， 然 后 连接 目标 文件 。 


$ cdz 

$ gcc -g -c b.c 
$d 

$ gcc -g a.c z/b.o 
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然而 ， 如 果 有 很 多 函数 要 连接 ， 这 些 函 数 可 能 来 目 人 不 同 的 源 文 件 ， 而 且 这 些 函 数 对 于 将 来 要 
编写 的 程序 可 能 有 用 ， 那 么 可 以 创建 一 个 库 《〈 这 是 一 个 存档 文件 )。 库 文件 分 为 两 种 。 当 编 详 调 
Fi BAS PE P PR RC EE ST, 那 坚 函数 变 成 最 终 可 执行 文件 的 一 部 分 。 为 一 方面 , 如 末 库 是 动态 的 ， 
那么 上 只 有 实际 执行 了 程序 ， 这 些 函 数 才 会 真正 附加 到 调用 代码 上 。 

下 面 介绍 如 何 为 本 节 的 示例 创建 毅 态 库 ， 假 设 名 为 /288.a。 


$ gcc -g -c b.c 
$ ar rc lib88.a b.o 


这 里 的 ar 命 令 从 它 在 文件 b.o 找 到 的 函数 中 创建 了 库 1i588.4a。 然 后 编 详 主 程序 : 











$ gcc -g a.c -188 -Lz 


这 里 的 -1 选项 是 一 种 快捷 方式 ， 与 如 下 代码 的 效果 相同 : 
$ gcc -g a.c lib88.a -Lz 


这 个 选项 指示 GCC 告 诉 LD， 它 将 需要 在 库 1ib88.a (或 者 下 面 将 要 介绍 的 动态 变 体 ) 中 查找 函数 。 








说 明 在 Unix 系 统 上 ， 按 惯例 是 在 静态 库 文件 名 后 面 加 上 后 级 .aq，a 代 表 archive。 田 外 ， 任 何 库 的 
名 称 一 般 都 以 Lib 开 头 。 


-1 选项 指示 GCC 告诉 LD 在 查找 函数 时 顺便 在 其 他 目录 中 也 查找 一 下 《 除 当前 目录 和 默认 搜 
索 目录 以 外 )。 在 本 节 的 示例 中 ，z 就 是 这 样 的 目录 。 

这 种 方法 的 缺点 是 ， 如 果 有 很 多 程序 在 使 用 同一 个 库 ， 那 么 每 个 程序 都 会 在 磁盘 上 包含 访 
库 的 独立 副本 ， 这 样 比较 浪费 空间 。 使 用 动态 库 可 以 解决 这 个 问题 (代价 是 需要 一 点 额外 的 加 
载 时 间 )。 

在 这 里 的 示例 中 ， 使 用 GCC 直接 创建 动态 库 ， 而 不 是 使 用 wr。 在 z 中 将 运行 : 


$ gcc -fPIC -c b.c 
$ gcc -shared -o lib88.so b.o 


ix EO GE udElibS8.so. (Unix F fi 44 AS FEY oa 49] zs VES Jer 2 so v shared 
object， 后 面 可 能 会 跟着 版 本 号 。) 与 连接 静态 库 一 样 地 连接 到 这 个 动态 库 : 


$ gcc -g a.c -188 -Lz 























然而 ， 它 现在 的 工作 方式 有 所 人 不同。 在 静态 库 的 情况 下 ， 从 库 中 调用 的 函数 会 成 为 可 执行 文 





件 ca.owt 的 一 部 分 ， 现 在 wovt 仅 包 合 一 个 表示 程序 使 用 了 库 12288.so 的 符号 。 重 要 的 是 ， 这 种 符号 
甚至 没有 表明 该 库 位 于 何 处 。GCC《〈 同 样 ， 实 际 上 是 LD) 要 在 编 详 时 得 看 / 动 88.so 的 唯一 原因 是 
为 了 得 到 连接 所 需 知 道 的 该 库 的 信息 。 

连接 本 身 会 在 运行 时 发 生 。 操 作 系 统 会 搜索 1ib88.s50， 然 后 将 它 连 接 到 程序 中 。 这 就 带 来 了 
操作 系统 在 何 处 执行 这 种 搜索 的 问题 。 
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首先 ， 使 用 1dd 命 令 检 查 程 序 需 要 哪些 库 ， 如 打 有 ， 操 作 系 统 可 以 在 何 处 找到 和 它们。 


$ ldd a.out 
lib88.so -» not found 
libc.so.6 => /lib/tls/libc.so.6 (0x006cd000) 
/lib/ld-linux.so.2 (0x006b0000) 


该 程序 需要 C 库 ， 并 在 目录 MipMis 中 找到 了 它 ， 但 是 操作 系统 没有 找到 1288.so。 后 者 在 目录 
/Debug/z 中 ， 但 是 该 目录 不是 操作 系统 的 正和 党 搜索 路 任 有 的 一 部 分 。 
解决 这 种 问题 的 一 种 方式 是 癌 该 搜索 路 径 中 添加 /Deprxeyz: 


为 setenv LD LIBRARY PATH ${LD_ LIBRARY PATH}:/Debug/z 


如 果 要 添加 几 个 目录 ， 将 目录 名 连同 冒号 的 字符 串 作 为 分 隔 符 。( 这 适用 于 C shell a£ TC 
shell.) 对 于 bash， 执 行 如 下 命令 : 


$ LD LIBRARY PATH=$LD LIBRARY PATH:/Debug/z 
$ export LD LIBRARY PATH 


让 我 们 确保 它 能 成 功 运 行 : 
$ ldd a.out 
lib88.so => /Debug/z/lib88.so (Oxf6ffe000) 


libc.so.6 => /lib/tls/libc.so.6 (0x006cd000) 
/lib/ld-linux.so.2 (0x006b0000) 


虽然 还 有 其 他 多 种 方法 ， 但 是 那些 方法 不 在 本 书 介绍 范围 之 列 。 

2. 开源 软件 中 库 的 用 法 

开源 软件 现在 很 流行 ， 尤 其 是 在 Linux 用 户 之 间 。 然 而 有 时 会 出 现 一 个 问题 ， 即 与 源 代 但 配 
套 有 的 构建 脚本 (通常 起 名 为 confieure〉 找 不 到 某 些 必需 的 库 。 试 图 通过 设置 LD_LIBRARY_PATH 环 
卉 变量 解决 该 问题 可 能 会 失败 。 由 于 这 个 问题 处 于 这 里 讨论 的 “缺少 库 ” 主 题 下 ， 而 且 源 代码 包 
中 通常 没有 记载 ， 因 此 这 里 有 必要 做 一 下 简单 的 解释 。 

这 种 问题 的 根源 季 第 在 于 cozjfigwre 调 用 的 名 为 pkecozjig 的 程序 。 这 个 程序 会 从 某 些 元 数据 文 
件 处 检索 关于 库 的 信息 。 这 样 的 文件 后 绥 为 .pc， 前 绥 是 库 的 名 称 。 人 例如， 文件 jipgcj.pc 中 包含 库 
文件 libgcj.so* 的 位 置 。 

pkconfige 搜 索 .pc 文 件 的 默认 目录 取决 于 pkeconfig 本 身 的 位 置 。 例如 ， 如果 程序 位 于 /sr/bin 中 ， 
则 搜索 /usrNAibp。 如 果 所 和 需 的 库 是 /usr/locaWUibp， 仪 在 这 个 目录 中 搜索 整 不够。 为 了 解决 这 个 问题 ， 
应 设置 环境 变量 为 PKG_CONFIG PATH。 在 C 或 TC shell 中 ， 执 行 如 下 shell 命 令 : 









































% setenv PKG CONFIG PATH /usr/lib/pkgconfig:/usr/local/lib/pkgconfig 


6.2 ”调试 GUI 程序 
如 今 ， 用 户 习 惯 于 应 用 程序 带 有 GUI (图 形 用 户 界 面 )。 当 然 ，GUI 也 是 程序 ， 因 此 可 以 应 用 
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一 般 调试 原理 ， 但 是 会 有 一 些 特殊 考虑 事项 。 

GUI 编 程 主要 是 调用 某 个 库 以 便 在 屏 笑 上 执行 各 种 操作 。 市 面 上 有 很 多 很 多 这 样 的 库 ， 用 途 
HWA Z. PARIDA Am. BEDE ETARE, REREH. 

因此 ,我 们 选择 了 最 简单 的 示例 ，curses 库 。 这 个 库 简 单 到 很 多 人 可 能 根本 没有 把 它 当 成 GUI 
(有 个 学 生 称 之 为 “基于 文本 的 GUI”)， 但 是 它 能 说 明 问 题 。 
调试 curses 程 序 


程序 员 可 以 使 用 curses 库 编写 让 光标 在 屏 秦 上 移动 的 代码 ， 改 变 字 符 的 闫 色 ， 或 者 改 成 反 白 
显示 ， 插 入 及 删除 文本 ， 等 等 。 

例如 ， 像 Vim 和 Emacs 这 样 的 文本 编辑 右 束 是 用 curses 编 写 的 。 在 Vim 中 ， 按 下 j 键 使 光标 癌 下 
移 一 行 。 键 入 dd 导致 删除 当前 行 ， 这 一 行 下 面 的 代码 行 同 上 移 一 行 ， 上 面 的 代码 行 仍 然 不 变 。 这 
些 动 作 通 过 调用 curses 库 中 的 函数 实现 。 

为 了 使 用 curses， 必 须 在 源 代 码 中 包括 如 下 语句 : 




















#include «curses.h» 
还 必须 连接 到 curses 库 : 

gcc -g sourcefile.c -lcurses 

以 下 和 面 这 段 代 码 为 例 。 该 代码 运 行 Unix 的 命令 ps ax 来 列 出 所 有 进程 。 在 任何 给 定时 间 ， 都 
必须 突出 显示 光标 当前 所 在 的 行 。 按 Fu 和 d 键 可 以 将 光标 同上 或 癌 下 移动 ， 等 等 。 参 见 代 人 码 中 的 
注释 合 看 完整 的 命令 列表 。 

如 果 以 前 没有 使 用 过 curses， 不 要 担心 ， 因 为 注释 中 说 明了 这 个 库 是 做 什么 的 。 


// psax.c; illustration of curses library 














// read this code in a "top-down" manner: first these comments and the global 
// vavriahles. then mainf). then the functions called hv mainí? 
£r V CAL LCL LL VS D 3 LINII ICALI Fg CIN-II Li Mb UL -LET 了 © LL -LS 中 vy WIA LUT y 


// runs the shell command ‘ps ax and saves the last lines of its output, 
// as many as the window will fit; allows the user to move up and down 


// within the window, with the option to kill whichever process is 
// currently highlighted 


if bic A xao p^ E AXE 

ff u»dgc:. praA 

// user commands: 

// ‘u': move highlight up a line 


// 'd': move highlight down a line 
// 'k': kill process in currently highlighted line 
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// 'r': re-run ps ax for update 
// 'q': quit 


// possible extensions: allowing scrolling, so that the user could go 
// through all the 'ps ax' output, not just the last lines; allow 

// wraparound for long lines; ask user to confirm before killing a 

// process 


Hdefine MAXROW 1000 
Hdefine MAXCOL 500 


#include «curses.h» // required 
WINDOW *scrn; // will point to curses window object 


char cmdoutlines[MAXROW][MAXCOL]; // output of ‘ps ax' (better to use 
// malloc()) 
int ncmdlines,  // number of rows in cmdoutlines 
nwinlines, // number of rows our "ps ax" output occupies in the 


// xterm (or equiv.) window 


nt vr nmnacitin 


FTT Ji rirra mn 3 er 
MUM d if Ww LAL Llib LW pMOLLLVII LIT 2X. 


cmdstartrow, // index of first row in cmdoutlines to be displayed 
cmdlastrow; // index of last row in cmdoutlines to be displayed 


F 


// rewrites the line at winrow in bold font 
highlight() 
{ 
int clinenum; 
attron(A BOLD); // this curses library call says that whatever we 
// write from now on (until we say otherwise) 
// will be in bold font 
// we'll need to rewrite the cmdoutlines line currently displayed 
// at line winrow in the screen, so as to get the bold font 
clinenum = cmdstartrow + winrow; 
mvaddstr(winrow, 0, cmdoutlines[clinenum]); 
attroff(A BOLD); // OK, leave bold mode 
refresh(); // make the change appear on the screen 


// runs "ps ax" and stores the output in cmdoutlines 
runpsax() 
{ 
FILE *p; char In[MAXCOL]; int row, tmp; 
p = popen("ps ax","r"); // open UNIX pipe (enables one program to read 
// output of another as if it were a file) 
for (row = 0; row < MAXROW; row++) { 


图 灵 社 区 会 员 cindy282694 GS 尊重 版 权 


6.2 ix GUI 42 165 


tmp = fgets(1n,MAXCOL,p); // read one line from the pipe 
if (tmp == NULL) break; // if end of pipe, break 
// don't want stored line to exceed width of screen, which the 
// curses library provides to us in the variable COLS, so truncate 
// to at most COLS characters 
strncpy(cmdoutlines[row],1n,COLS) ; 
cmdoutlines[row][MAXCOL-1] = 0; 
} 
ncmdlines = row; 
close(p); // close pipe 


// displays last part of command output (as much as fits in screen) 
showlastpart() 
{ 
int row; 
clear(); // curses clear-screen call 
// prepare to paint the (last part of the) 'ps ax' output on the screen; 
// two cases, depending on whether there is more output than screen rows; 
// first, the case in which the entire output fits in one screen: 
if (ncmdlines <= LINES) { // LINES is an int maintained by the curses 
// library, equal to the number of lines in 
// the screen 
cmdstartrow - 0; 
nwinlines - ncmdlines; 
} 
else { // now the case in which the output is bigger than one screen 
cmdstartrow = ncmdlines - LINES; 
nwinlines = LINES; 


} 


cmdlastrow = cmdstartrow + nwinlines - 1; 

// now paint the rows to the screen 

for (row = cmdstartrow, winrow = 0; row <= cmdlastrow; row++,winrow++) 

mvaddstr(winrow,0,cmdoutlines[row]); // curses call to move to the 

// specified position and 
// paint a string there 

refresh(); // now make the changes actually appear on the screen, 

// using this call to the curses library 


// highlight the last line 
wlnrow--; 
highlight(); 


// moves cursor up/down one line 
updown(int inc) 


{ 
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int tmp = winrow + inc; 
// ignore attempts to go off the edge of the screen 
if (tmp >= 0 8& tmp « LINES) 1 
// xewrite the current line before moving; since our current font 
// is non-BOLD (actually A NORMAL), the effect is to unhighlight 
// this line 
mvaddstr(winrow,O0,cmdoutlines[winrow]); 
// highlight the line we're moving to 
winrow - tmp; 
highlight(); 


// run/re-run "ps ax" 
rerun() 
{ 
runpsax(); 
showlastpart(); 


// kills the highlighted process 
prockill() 
{ 
char *pid; 
// strtok() is from C library; see man page 
pid = strtok(cmdoutlines[cmdstartrowtwinrow]," "); 
kill(atoi(pid),9); // this is a UNIX system call to send signal 9, 
// the kill signal, to the given process 


rerun(); 
} 
main() 
{ 

char c; 


// window setup; next 3 lines are curses library calls, a standard 
// initializing sequence for curses programs 
scrn = initscr(); 
noecho(); // don't echo keystrokes 
cbreak(); // keyboard input valid immediately, not after hit Enter 
// run ‘ps ax and process the output 
runpsax(); 
// display in the window 
showlastpart(); 
// user command loop 
while (1) (1 
// get user command 
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= getch(); 
if (c == 'u') updown(-1); 
else if (c == 'd') updown(1); 
else if (c -- 'r') rerun(); 
else af (c == "k") prockill(); 
else break; // quit 
} 
// restore original settings 
endwin(); 
} 
运行 这 个 程序 ， 将 友 现 从 图 上 看 一 切 正常 ， 但 是 当 按 下 u 键 使 光标 同上 移动 一 行 时 ， 却 没有 
正确 地 反应 ， 如 图 6-1 所 示 。 
File Edit View Terminal Tabs Help 
5912 ? S 0:00 /usr/lib/nautilus-cd-burner/mapping-daemon 四 
5916 ? S 6:00 klauncher [kdeinit] 
5922 ? S 0:08 gnome-pty-helper 
5923 pts/0 Ss 0:00 -csh 
5926 ? 5 0:00 kded [kdeinit] 
5949 ? S 0:00 /usr/lib/fast-user-switch-applet/fast-user-switch-app 
5951 ? Sl 0:00 /usr/bin/python /usr/lib/deskbar-applet/deskbar-apple 
5953 ? Sl 0:00 /usr/lib/gnome-applets/mixer applet2 --oaf-activate-i 
5962 pts/0 S+ 0:01 ssh laura.cs.ucdavis.edu -l matloff 
5964 ? S 0:01 /usr/lib/notification-daemon/notification-daemon 
5966 pts/1 SS+ 0:08 -csh 
6498 ? S 0:00 /bin/sh /usr/bin/firefox 
6510 ? S 0:00 /bin/sh /usr/lib/firefox/run-mozilla.sh /usr/lib/fire 
6514 ? Sl 0:52 /usr/lib/firefox/firefox-bin 
6545 pts/2 SS 二 0:08 -csh 
6971 pts/4 Ss 6:00 -csh 
7114 ? S 0:08 knotify [kdeinit] 
7117 ? S 0:03 /usr/bin/artsd -F 10 -S 4096 -s 60 -m artsmessage -l 
7118 ? S 0:00 kio file [kdeinit] file 
7146 pts/4 S 0:99 qiv 06-fig01.jpg 
7149 pts/1 S 0:07 xpdf my6.pdf 
7162 pts/4 S+ 8:88 psax 
2270 ? S« 6:00 [ata/0] 
2271 ? S< 0:00 [ata/1] - 
图 6-1 A^ 28 in af FP Be 11 Tir DU 
ps ax 的 输出 是 按 进 程 写 的 升序 排列 的 ， 然 而 突然 发 现 2270 显 示 在 7162 后 面 。 让 我 们 跟踪 这 
个 程序 错误 。 
curses 程 序 是 编写 调试 类 图 书 作 者 的 一 个 梦想 ， 因 为 它 使 程序 员 不 得 不 使 用 调试 工具 。 程 序 











员 不 能 使 用 printf() 调 用 或 cout 语 句 来 输出 调试 信息 , 因为 这 样 的 输出 会 
一 起 ， 从 而 造成 混乱 。 
1. 使 用 GDB 


与 程序 输出 本 身 混合 在 








启动 GDB， 但 是 相对 于 上 一 次 ， 我 们 必须 做 一 件 额 外 的 事 。 我 们 必须 告诉 GDB 让 程序 在 不 
同 的 终端 窗口 中 执行 ， 而 不 是 GDB 正 在 其 中 运行 的 那个 窗口 。 可 以 使 用 GDB 的 tty 命 令 来 完成 这 件 
事 。 首 先 ， 进 入 另 一 个 用 来 完成 程序 IO 的 窗口 ， 并 在 其 中 运行 Unix 的 tty 命 令 来 确定 该 窗口 的 ID。 





在 这 种 情况 下 ， 该 命令 的 输出 告 


(gdb) tty /dev/pts/8 


诉 我 们 ， 那 个 窗口 是 终端 号 /dev/pts/8， 因 此 在 GDB 窗 口中 输入 : 
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ALES. AREY I T-BAR T AIT Bat HP 
在 开始 前 的 最 后 一 件 事 是 : 必须 在 执行 窗口 中 键入 区 似 如 下 代码 : 
sleep 10000 


这 样 在 该 窗口 中 的 键盘 输入 会 进入 程序 ， 而 不 是 进入 shell。 








说 明 还 有 其 他 方式 可 以 处 理 将 GDB 输 出 与 程序 输出 分 开 的 问题 。 例 如 ， 可 以 先 开 始 程 序 的 执行 ， 
然后 在 另 一 个 窗口 中 激活 GDB， 将 它 附加 到 正在 运行 的 程序 后 面 。 





接 下 来 ,因为 错误 发 生 在 试图 将 光标 辐 上 移 的 时 候 ， 所 以 在 函数 updown() 的 开头 设置 一 个 断 








点 。 然 后 ， 当 键入 run 时 ,程序 会 开始 在 执行 窗口 中 执行 。 在 该 窗口 中 按 下 u 键 ，GDB 会 在 设置 的 
Ir xa b P LE. 
(gdb) x 


Starting program: /Debug/psax 
Detaching after fork from child process 3840. 


Breakpoint 1, updown (inc--1) at psax.c:103 
103 { int tmp = winrow + inc; 


首先 ， 确 认 变量 tmp 值 的 正确 性 。 
(gdb) n 


105 if (tmp >= 0 && tmp « LINES) { 
(gdb) p tmp 

$2 = 22 

(gdb) p LINES 

$3 = 24 


APtEwinrowNkzN J Gite A O FRKA. MWA DV IEE f ORE. LINESBS N24, 
因此 winrow 应 当 为 23， 因 为 是 从 0 开始 编号 的 。inc 等 于 -1《〈 因 为 我 们 在 将 光标 同上 移 ， 而 不 是 问 
下 移 )， 所 以 如 这 里 所 示 ， 确 认 了 tmp 的 人 为 22。 

现在 ， 让 我 们 来 到 下 一 行 。 

(gdb) n 

109 mvaddstr(winrow, 0, cmdoutlines[winrow]); 


(gdb) p cmdoutlines[winrow] 
$4 = " 2270 ? Ss 0:00 nifd -n\n", 'XO' «repeats 464 times» 


显然 ， 这 是 来 到 了 进程 2270 的 那 一 行 。 我 们 很 快意 识 到 源 代 但 中 的 如 下 代码 行 : 








mvaddstr(winrow,O0,cmdoutlines|winrow]); 


应 当 为 : 
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mvaddstr(winrow, 0, cmdoutlines[ cmdstartrow+winrow ] ); 


修复 了 这 个 问题 后 ， 程 序 就 能 正确 地 运行 。 
完成 后 ， 在 执行 窗口 中 按 下 Ctrl+C 组 合 键 ， 以 便 终 止 sleep 命 令 ， 并 使 shel 再 次 回 到 可 用 状 

















主意 ， 如 果 因 为 出 了 错 使 程序 过 早 结束 ， 那 么 该 执行 窗口 可 能 会 保留 部 分 非 标 准 终 端 议 置 ， 
项 cbreak 模 式 。 为 了 修复 这 一 问题 ,来 到 那个 窗口 中 并 按 下 Ctrl+J 组 合 键 , 然后 键入 单词 reset， 
之 后 绸 次 按 下 Ctrl+J 组 合 键 。 
2. 使 用 DDD 
使 用 DDD 调 试 是 什么 情况 呢 ? Tee a RT 程序 。 选 择 View 一 Execution 
Window，DDD 会 弹出 一 个 执行 窗口 。 注 意 ， 不 需要 杀 目 在 该 窗口 中 键入 sleep 命 令 ， 因 为 DDD 
Mi SIRES. GRRE AN HM nidos 








DDD: Execution Window 


11:24 metacity —sm-save-file 1049227628-1382-427732581 .ms 
0:25 gnome-power-manager 
0:26 nautilus —sm-config-prefix /nautilus-SPWf8M/ —sm-cl 
0:33 gnome-panel —sm-config-prefix /gnome-panel-61M1YE/ 一 
0:33 gnome-volume-manager —sm-config-prefix /magicdev—HDV 
ae /usr/libexec/gnome-vfs-daemon —oaf-activate-iid-OAFI 
? gnome-terminal —sm-config-prefix /gnome-terminal-iLY 
: acm in —dbus 
applet —sm-di sable 
:04 er bln a panel ten —sm-client-id 11aSed06710001 
0 /sbin/pam timestamp check -d root 
0 /usr/libexec/mapping-daemon 
0 SIS DEVE holper 


2 1 Jusr/1ibexec/onck-applet —oaf-—activate—i id=OAFIID: GN 


2 Just /ibexec/clock-applet —oaf-activate—i id=OAFIID: G 


i car E D —oaf-acti vate- 
gnome-screensaver 

Aor] diac /gun-sprvar 

[pdf lush] 

00 [pdflush][] 


DDD: /debtrg/psax.c 














int tmp = winrow + inc; 
// ignore attempts to in s the edge of the screen 
if (tmp >= 0 && tmp < LINES) £ 
// rewrite the B PRIN line before moving; since our current for 
// is non-BOLD (actually A NORMAL), the effect is to unhighlig 
// this line 
@  mvaddstr(winrow,0, cmdoutlines [winrow]); 
// highlight the line we're moving to 
winrow — tmp; 
j highlight); 
3 


// run/re-run "ps ax" 
rerun 
i 


runpsaxQ: 
showlastpartQ:; 


library "/lib/libthread db.so.1" 
(gdb) run 


30184 ? S 0:00 [pdflush]30194 ? 0:00 [pdflush]q 


Program exited normally. 

(gdb) No breakpoints or watchpoints. 

(gdb) break psax.c:115 

Breakpoint 1 at 0x8048aea: file psax.c, line 116. 
(gdb) run 

















图 6-2 ”在 DDD 中 附加 到 运行 程序 上 
照样 设置 断 点 ， 但 是 记 住 要 在 执行 窗口 中 键入 程序 输入 。 
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3. 使 用 Eclipse 

首先 要 注意 ， 在 构建 项 目 时 ， 需 要 让 Eclipse 在 make 文 件 中 使 用 -lcurses 标 志 ， 这 一 过 程 参 见 
第 5 章 的 相关 介绍 。 

这 里 也 需要 一 个 单独 的 执行 窗口 。 可 以 在 建立 调试 对 话 框 时 做 这 件 事 。 当 像 惯 常 一 样 建立 
运行 对 话 框 并 选择 Run 一 Open Debug Dialog 时 ， 我 们 将 采取 与 目前 所 采用 方法 略微 不 同 的 其 他 
方式 。 在 图 6-3 所 示 界 面 中 ， 注 意 到 除了 通常 的 选项 C/C++Local Application 外 ， 还 有 选项 C/C++ 
Attach to Local Application。 后 者 意味 着 要 让 Eclipse 使 用 GDB 能 力 来 将 它 本 身 附 加 到 一 个 已 经 运 
行 的 进程 上 《第 $ 章 讨论 过 )。 碳 击 C/C++ Attach to Local Application， 选 择 New， 并 像 以 前 一 样 继 
续 进 行 下 去 。 
































Debug 


Create, manage, and run configurations 








er Configure launch settings from this dialog: 


* - Press the 'New' button to create a configuration of the selected type. 


iz) - Press the 'Duplicate' button to copy the selected configuration. 
[c] C/C++ Attach to Local Applic 


> [E]C/C+ Local Application 
加 C/C++ Postmortem debuggt «> - Press the ‘Filter’ button to configure filtering options. 


- Press the 'Delete' button to remove the selected configuration. 


- Edit or view an existing configuration by selecting it. 


Configure launch perspective settings from the Perspectives preference page. 











Filter matched 7 of 7 items 





© 








图 6-3 ”在 Eclipse 中 附加 到 运行 程序 上 


当 开 始 实际 运行 调试 时 ， 首 先 在 一 个 单独 的 shell 窗 口中 局 动 程 序 。 (A EES id, 2E HI BE 
位 于 Eclipse 工作 衬 间 目录 中 。) 然后 像 首 次 进行 调试 运行 时 篆 做 的 那样 ， 选 择 Run 一 -Open Debug 
Dialog。 在 这 种 情况 下 ，Eclipse 会 弹出 一 个 窗口 列 出 所 有 进程 ， 要 求 你 选择 希望 GDB 附 加 到 哪个 
进程 。 这 一 过 程 如 图 6-4 所 示 ， 其 中 显示 了 psax 进 程 的 ID 为 12319〈 注 意 ， 该 程序 在 另 一 个 窗口 中 
运行 ， 这 里 局 部 地 隐 首 了 ) 。 单 击 该 进 程 ， 然 后 单 击 OK， 出 现 图 6-$ 所 示 的 情形 。 

在 图 6-$ 中 ， 可 以 看 到 程序 在 系统 调用 期 间 停 止 了 。Eclipse 发 出 通知 ， 表 明 它 没有 当前 指令 
的 源 代码 ， 但 这 是 预料 之 中 的 ， 没 有 问题 。 实 际 上 ， 这 是 在 源 文件 psax.c 中 设置 断 点 的 好 时 机 。 
设置 以 后 ， 单 击 Resume 狗 标 。Eclipse 会 一 下 运行 ， 直 到 遇 到 第 一 个 断 点 ， 然 后 可 以 照例 调试 。 
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Ele Edit View Terminal Tabs Help 
29127 ? 0:25 gname-power-manager 
29131 ? 0:26 nautilus --sm-config-prefix /nautilus-9PWf8M/ --sm-cl 
29133 ? 0:34 gname-panel --sm-config-prefix /gname-panel-6lMlYE/ -| 
29134 ? 0:33 gname-volume-manager —sm-config-prefix /magicdev- 
29137 ? 0:08 /usr/libexec/gname-vfs-daemon --oaf-activate-iid-OAFI 
29141 ? 9:39 gname-terminal --sm-config-prefix /gname-temminal-iL' 
J/RS/tmp (deleted) --window-with-profile-internal-id=Default --show-menubar 一 wo 
29145 ? Ss 0:00 bluez-pin —dbus 
29154 ? 0:02 nm-applet --sm-disable 
29157 ? ( 
29160 ? 
29169 ? 
29171 ? 
29172 pts/2 
29183 ? 
29198 pts/3 
29204 pts/4 
29208 ? 
29217 pts/5 
29239 ? 
29299 ? 
29706 ? 
30192 ? 
30194 ? 


Edit Refactor Navigate Search Run Project Window Help 


Select Process 








Select a Process to attach debugger to: 


i 


[p mun- 11815 

[c] psax Debug (1) [C/C++ Attach to Lo B» nautilus - 29131 

B» nm-applet - 29154 

B» notification-area-applet - 29239 
B» ntpd - 2381 














uuu uw uw uv "uou 
gegoggegvovegp 
EDESOPTSPMREESCES 


B» pam-paneticon - 29157 
B» pam. timestamp. check - 29160 











L. - - B» portmap - 2045 
因 psaxc "a x B» psax - 12319 
s B» python - 2332 








char c; 

// window setup; next 
// initializing seque 
scrn = initscr(); 
noecho(); // don't ed 
cbreak(); // keyboarq 
// run 'ps ax' and prd scrn : WINDOW* 
runpsax(); cmdoutlines : chari 
// display in the wind 
showlastpart(); 


// user command loop 
while (1) £ 

















íg Casi x x] Tasks 区 Problems. ie) r4 E- ri ^ =) 
|C-Buik [psa] 

















|**** Build of configuration Debug for project psax **** 


| 
(make all 
|make: Nothing to be done for 'all'. 








| Launching psax Debug (1): (5796) 





图 6-4 选择 要 将 GDB 附 加 到 的 进程 


Elle Edit View Terminal Tabs Help 

29127 ? Ss 0:25 gnome-power-manager 

29131 ? Ssl 0:26 nautilus --sm-config-prefix /nautilus-9PWf8M/ —sm-cl| 
29133 ? Ssl 0:34 gnome-panel —sm-config-prefix /gnome-panel-6lMlYE/ - 
29134 ? Ss 0:33 gnome-volume-manager --sm-config-prefix /magicdev-HDV| 
29137 ? sl 0:08 /usr/libexec/gnome-vfs-daemon --oaf-activate-iid-OAFI| 
29141 ? Ssl 9:39 gnome-terminal --sm-config-prefix /gnome-terminal-iLY| 
J/RS/tmp (deleted) --window-with-profile-internal-id-Default --show-menubar --wo| 
29145 ? 
29154 ? 
29157 ? 
29160 ? 
29169 ? 
29171 ? 
29172 pts/2 
29183 ? 
29198 pts/3 
29204 pts/4 
29208 ? 
29217 pts/5 
29239 ? 
29299 ? 
29706 ? 
30192 ? 
30194 ? 


0:00 bluez-pin --dbus 
0:02 nm-applet --sm-disable 


Debug - Source not found. - Eclipse Platform 
Eile Edit Navigate Search Run Project Window Help 
|r u |B | %- 0- a | e Jà- ci (Brome) ace 
[$5 Debug 54 ee Breakpoints |09 Variables 23 ^. Hf Registers | mi Modules | an) 
| üp E 元 日 | 多 
| 回 psax Debug (1) [C/C++ Attach to Local Application] 
"v GP gdb/mi (12/26/07 1:45 PM) (Suspended) 
vv. f Thread [0] (Suspended) 

£24. read nocancel) 0x00ac8e93 

£53 nc wgetch() 0x0388e02a 

三 2 wgetch() 0x0388e32c 


* 








* 








"wovpopoppopoooonpmop 
* 
Se SE eeee sf ooo = 











| [8 psaxc la 5 kernel vsyscal) 0x00ca7402 $3 EX | Ez Outline 33 
. (An outline is not available. 


| No source available for" kernel vsyscall() * 














Z Tasks | 区 Problems (J Memory 
psax Debug (1) [C/C++ Attach to Local Application] gdb (12/26/07 1:45 PM) 








图 6-5 ”在 内 核 中 集 止 
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其 他 工具 





人 
"月 名 种 名 样 的 其 他 调试 工具 ,免费 的 和 需 付费 的 都 有 ， 它 们 也 可 以 帮助 防止 、 检测 和 消 
除 代码 中 的 程序 错误 。 为 了 增强 调试 技能 ， 初 学 者 程序 员 最 好 学 会 其 中 的 几 种 调试 工具 ， 了 解 
哪 种 工具 适合 于 调试 哪 种 程序 错误 ， 并 识别 发 生 程序 错误 时 使 用 其 中 哪个 工具 可 以 节省 时 间 和 
精力 。 

到 目前 为 止 我 们 的 焦点 都 集中 在 使 用 符号 调试 器 上 , 现在 我 们 把 覆盖 面 扩展 到 调试 的 其 他 方 
面 ,包括 防御 性 编程 。 本 章 专门 介绍 除 GDB 外 的 部 分 工具 和 技术 ， 这 些 工具 和 技术 对 于 在 一 开始 
防止 程序 错误 产生 以 及 程序 错误 产生 后 进行 查找 及 修复 都 是 很 有 用 的 。 


7.1 充分 利用 文本 编辑 器 


最 好 的 调试 方法 是 一 开始 就 不 要 有 编程 错误 ! 人 们 往往 最 容易 忽略 一 种 “ 预 调试 ”方式 : 充 
分 用 好 一 种 文 持 纺 程 的 编辑 内 。 

如 朱 你 伦 在 编码 上 的 时 间 很 长 ,我 们 强烈 建议 你 仔细 考 碟 选择 哪 种 编辑 左 ， 并 尽 可 能 地 充分 
学 习 将 使 用 的 编辑 右 。 这 样 做 有 两 个 忌 因 。 首 先 ， 精 通 强大 的 编辑 状 可 以 绾 短 编写 代码 所 需 的 时 
间 。 有 共有 目 动 缩 排 、 单 词 补 全 和 全 文 符号 得 询 等 特殊 功能 的 编辑 天 对 程序 员 非 常 有 利 ， 市 面 上 现 
在 有 数 种 这 样 的 编辑 硕 可 以 选择 。 其 次 ， 优 秀 编辑 喜人 而 实 可 以 带 助 编码 者 在 编号 代码 时 捕获 茶 些 
类 型 的 程序 错误 ， 这 正 是 本 市 要 介绍 的 内 容 。 

本 书 两 位 作者 都 是 使 用 Vim 编 程 的 ， 因 此 这 种 编辑 此 是 我 们 将 重点 介绍 的 内 容 。 然 而 ， 所 有 
流行 编辑 需 都 有 相似 《即便 不 相同 ) 的 功能 。 如 采 Vim 能 提供 Emacs 中 目前 没有 的 功能 ， 那 么 使 
用 Emacs 的 开 及 人 员 会 很 快 园 而 使 用 Vim， 上 反之 尔 然 。 因 此 ， 虽 然 我 们 特 指 Vim， 但 是 这 里 介绍 的 
大 部 分 内 容 也 适用 于 Emacs 等 其 他 优秀 编辑 器 。 


7.1.1 语法 突出 显示 


Vim 的 语法 突出 显示 功能 可 以 用 不 同 闫 色 或 字体 显示 程序 的 一 部 分 ， 因 此 像 关 键 子 、 类 型 标 
识 和 全、 局 部 变量 和 预 处 理 絮 指令 等 代码 元 素 部 有 各 目的 磊 色 和 子 体 模式 。 编辑 右 通过 俘 看 文件 名 
的 扩展 名 来 判断 使 用 的 是 什么 语言 , 然后 选择 相应 的 颜色 和 子 体 。 例 如, 如 下文 件 名 以 .pl 结尾 ( 表 
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示 一 个 Perl 脚 本 )， 那 么 突出 显示 单词 die ( 它 是 Perl 函 数 名 )， 而 如 果 以 .c 结 尾 ， 怠 不 突出 显示 这 个 
单词 。 

更 好 的 语 读 突 出 显示 的 名 称 是 词汇 突出 显示 ， 因 为 编辑 器 一 般 不 会 太 细致 地 分 析 语 法 。 它 不 
能 指出 在 函数 调用 中 参数 数量 有 错 或 者 参数 类 型 有 误 。 它 只 能 理解 aress 和 jzreacjp 等 单词 是 Perl 天 
pi, fmt#lldimensionze Fortran ket +, JAHM HE ZR es 

即便 如 此 ， 语 法 突出 显示 对 于 捕获 人 简单 但 容易 犯 的 错误 仍然 非常 有 用 。 例 如 ， 在 我 们 的 计算 
机 上 ， 像 C 语 言 中 的 FILE 或 float 关 键 字 这 样 的 类 型 标识 符 ， 默 认 颜 色 是 绿色 。 当 眼睛 习惯 于 这 
种 学 体 和 凑 色 后 ， 无 需 经 过 不 必要 的 编 详 周期 ， 误 拼 时 就 可 以 友 现 颜色 不 一 致 ， 并 目 动 纠正 这 一 
HIR e 

使 用 语法 突出 显示 的 一 个 示例 是 检查 出 现在 make 文 件 中 的 我 们 (作者 ) 喜欢 的 关键 字 。 
patsubst 关 键 学 是 一 种 用 于 make 文 件 的 非常 有 用 的 文本 合 找 和 和 蕉 换 命令 。 它 的 一 个 最 弟 见 的 用 法 
是 生成 项 目 源 代码 .c 文 件 中 的 .o 文 件 列 表 。 


TARGET = CoolApplication 
OBJS = $(patsubst %.c, %.0, $(wildcard *.c)) 
























































$(TARGET): $(0BJS) 


本 书 的 作者 中 有 一 位 始终 不 记得 它 是 patsubst、pathsubst 还 是 patsub。 知 道 了 make 文 件 关 
E 
= 











它 是 
EFEN GE) 显示 后 ， 你 能 看 出 图 7-1 所 示人 代码 行 中 哪个 版 本 是 错误 的 吗 ? 即使 你 不 知 
道 如 何 编写 make 文 件 ， 仅 仅 依 靠 突 出 显示 就 可 以 一 目 了 然 ! ” 








wildcard 
patsubst wildcard 








图 7-1 语法 突出 显示 表明 我 的 make 文 件 是 错误 的 


而 且 ， 下 向 是 一 个 更 为 姑 活 的 语法 突出 显示 示例 。 图 7-2 中 有 一 个 实 实 在 在 的 语法 错误 。 
这 时 ， 不 需要 过 多 地 思考 错误 是 什么 《或 错误 在 何 处 )， 只 要 根据 两 色 即 可 找 出 错误 。 

















if (fp == NULL) 
puts(" bad 


exit(1); 











图 7-2 ”语法 突出 显示 揭示 了 一 个 常见 的 错误 


图 7-3 是 为 一 个 类 似 错误 的 图 示 。 试 看 根据 闫 色 找 出 销 误 。 








CD 本 书 将 此 图 转换 成 了 灰 肛 模式， 在 实际 应 用 中 用 颜色 区 别 更 容易 识别 错误 。 
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fprintf(fp, " 





"I just wrote \"4s\" which is argument Z%d\n" 








图 7-3 ”语法 突出 显示 揭示 了 为 一 个 常见 错误 


如 果 友 现 语法 突出 显示 模式 中 的 某 些 闫 色 难 以 阅读 ， 可 以 通过 键入 如 下 代码 关闭 突出 显示 : 





: syntax off 
再 次 打开 颜色 模式 的 命令 当然 是 : 
: syntax on 
更 好 的 办 法 是 修改 语法 文件 ,对 那 种 类 型 的 关键 字 使 用 另 一 种 更 好 的 颜色 ,但 是 这 种 办 法 超 
出 了 我 们 这 里 的 讨论 范围 。 
7.1.2 ”匹配 括号 





说 明 ”本 节 中 的 括号 是 指 圆 括号 、 方 括号 和 花 括 号 ， 即 ()、[] 和 f{1}。 


括号 不 对 称 错误 极其 帝 见 ， 且 难以 捕获 。 来 看 如 下 代码 。 
mytype *myvar; 
if ((myvar = (mytype x)malloc(sizeof(mytype))) == NULL) { 
exit(-1); 
D 
请 立即 回答 : 代码 中 国 括 号 是 否 对 称 ?“ 你 是 否 曾 不 得 不 在 带 大 量 条 件 语 句 的 代码 块 中 跟踪 
不 对 称 的 括号 ? 或 者 有 没有 用 过 TEX? 我们 为 过 去 丢失 了 括 写 的 LATEX 文 件 而 汗 磊 !) 如 果 有 ， 
那么 你 肯定 会 同意 我 们 的 观点 : 这 完全 是 计算 机 要 负责 的 事情 , 怎 能 让 我 们 去 做 这 么 或 琐 的 工作 ! 
Vim 有 一 些 不 错 的 功能 有 助 于 检 奉 括 扎 是 个 匹配 。 
O 每 当 在 键 益 上 键入 括号 时 ， Vim 的 showmathc 选 项 使 Vim 和 暂时 把 光标 放 在 逻 配 的 括号 上 (如 
采 匹 配 括号 存在 并 且 在 屏幕 上 可 见 )。 通 过 设置 matchtime 变 量 ， 甚 至 可 以 控制 光标 在 匹 
配 括号 上 停留 多 长 时 间 《〈 以 十 分 之 一 秒 为 单位 )。 
a 当 光 标 在 一 个 括号 上 时 ， 键 入 百 分 写 会 将 光标 移 到 配对 括号 上 。 这 个 命令 是 跟踪 不 对 称 
括号 的 一 个 极 佳 方法 。 
a 将 光标 放 在 一 个 括号 上 时 ，Vim 会 突出 显示 与 其 匹配 的 另外 一 个 括号 ， 如 图 7-2 所 示 。 
编程 时 showmatch 选 项 是 有 用 的 ， 但 是 其 他 时 候 这 种 特性 比较 讨厌 。 可 以 使 用 目 动 命令 来 设 
置 这 个 选项 仅 在 编程 时 和 生效。 例如， 为 了 设置 showmatch 仅 适用 于 C/C++ 源 代码 文件 的 编辑 会 话 ， 
可 以 将 类 似 如 下 代码 行 放 在 .vimrc 文 件 中 (参见 Vim 的 帮助 文件 了 解 更 多 信息 )。 






























































CD 你 还 是 老 老实 实 承认 吧 ， 你 一 定 被 我 距 住 了 ， 还 以 为 它们 是 不 对 称 的 。 我 们 的 重点 不 是 指出 你 错 了 ， 而 在 于 说 明 
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au BufNewFile,BufRead *.c set showmatch 
au BufNewFile,BufRead *.cc set showmatch 


如 果 代 码 中 有 不 对 称 的 括号 , BC CERIN T D» ru EE EXACT] AR LC SEC EHI PT 
不 对 称 插 号 ， 该 怎么 办 呢 ? BUT Dae BN Ca Ao EA d ROGERII SER fd o E,W 
标 放 在 左 方 括 写 [ 上 ， 并 从 命令 模式 下 键入 %，Vim 束 会 将 光标 的 位 置 放 到 下 一 个 ] 字 符 上 。 如 果 
将 光标 放 在 右 花 括号 } 上 ， 并 调用 %， 那 么 Vim 会 将 光标 放 在 前 一 个 匹配 的 {字符 上 。 通 过 这 种 方 
式 ， 不 仪 可 以 验证 任何 给 定 的 圆 括号 、 论 括号 或 方 插 写 有 对 应 的 匹配 括 写 ,而且 可 以 验证 匹配 的 
括号 符合 语义 。 使 用 Vim 的 matchpair 命 令 甚 至 可 以 定义 其 他 匹配 的 “括号 ”对 ， 比 如 HTML 的 注 
释 定 界 符 <!-- 和 -->。 参 见 Vim 的 帮助 页 面 可 了 解 更 多 信息 。 


7.1.3 ”Vim 与 make 文 件 















































的 用 法 可 以 得 到 巨大 的 回报 。 然 而 ， 这 也 引入 了 新 的 出 错 机 会 。 如 果 使 用 make，Vim 有 几 个 有 益 
于 调试 过 程 的 功能 。 来 看 下 面 的 make 文 件 片段 。 


all: yerror.o main.o 
gcc -o myprogram yerror.o main.o 


yerror.o: yerror.c yerror.h 
gcc -C yerror.c 


main.o: main.c main.h 
gcc -c main.c 





该 make 文 件 中 有 一 个 错误 ， 但 是 很 难看 出 来 。make 对 于 格式 非常 挑 吻 。 目 标的 命令 行 必 须 以 
个 制 表 符 开头 ， 而 不 是 以 空格 开头 。 上 只 要 从 Vim 中 执行 set 1ist 命 令 ， 马 上 融 可 以 发 现 错误 所 在 。 





all: yerror.o main.o$ 
^Igcc -o myprogram yerror.o main.o$ 


yerror.o: yerror.c yerror.h$ 
^Igcc -c yerror.c$ 
$ 
main.o: main.c main.h$ 
gcc -c main.c$ 


在 list 模 式 中 ，Vim 显 示 不 可 打印 的 学 符 。 默 认 情 况 下 ， 行 末 的 字符 显示 为 $， 控 制 学 符 显 
示 为 插入 符号 〈^)， 因 此 ， 制 表 符 〈Ctrl+I) 显示 为 ^I。 因 而 可 以 将 空格 与 制 表 符 区 分 开 ， 铺 误 
很 容易 看 出 : main.o make 目 标的 命令 行 是 以 空格 开头 的 。 

使 用 Vim 的 listchars 选 项 可 以 控制 显示 内 容 。 例 如 ， 如 果 要 将 行 末 字符 改 成 = 而 不 是 $， 可 以 
使 用 :set listchars-eol:-. 


图 灵 社 区 会 员 cindy282694 GS 尊重 版 权 





176 第 7 章 其 他 工具 


7.1.4 make 文件 和 编译 器 警告 





从 Vim 中 调用 make 非 党 方便 。 例 如， 不 需要 手工 保存 文件 并 在 另 一 个 窗口 中 键入 make clean, 


只 要 从 命令 模式 下 键入 :make cleanB a]. (一 定 要 设置 autowrite， 因 此 在 运行 make 命 
可 以 自动 保存 文件 。) 一 般 而 言 ， 每 当 从 命令 模式 下 键入 如 下 代码 时 : 





:make arguments 


Vim 都 会 运行 make 并 将 orguments 传 递 给 它 。 








A Bj , Vim 


ERKA DA Vim PSS FEY. AE ns BRIAN PE nn CLARITATE Aso EE n EE 
GCC 输出 — 知道 何 时 发 生 编 详 占 管 告 或 蚀 误 。 让 我 们 再 看 一 下 实际 应 用 ,请 看 代码 清 








单 7-1。 
代码 清单 7-1 main.c 


#include <stdio.h> 


int main(void) 
i 


printf("There were 4d arguments. Nn", argc); 


if (argc .gt. 5) then 
print *, ‘You seem argumentative today'; 
end if 


return 0; 


} 





看 来 这 个 程序 员 既 使 用 了 Fortran 又 使 用 了 C 语 言 进行 编码 ! 假设 当前 在 编辑 main.c， 要 构建 


程序 。 从 Vim 中 执行 :make 命 令 ， 并 查看 所 有 错误 消息 (图 7-4)。 


: Imake 2>&1| tee /tmp/v243244/1 

gcc -std=c99 -W -wall main.c -o main 

main.c: In function 'main': 

main. : error: 'argc' undeclared (first use in this function) 
main. : error: (Each undeclared identifier is reported only once 
main. : error: for each function it appears in.) 

main. : error: expected identifier before numeric constant 
main. : error: ‘then’ undeclared (first use in this function) 
: error: expected ';' before ‘print’ 

:18: warning: character constant too long for its type 
main. : error: 'end' undeclared (first use in this function) 
main. : error: expected “;” before “if” 

make: *** [main] Error - 

(3 of 12): error: ‘argc’ undeclared (first use in this function) 
Press ENTER or type command to continue] 


main. 


main. 


00n00nnonmonn 





图 7-4 B DE TH As JC 


现在 ， 如 果 按 下 ENTER 或 空格 键 会 返回 到 编辑 程序 ， 但 是 光标 位 于 产生 第 一 条 警告 
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的 代码 行 上 【在 本 例 中 ， 位 于 未 声明 argc 的 消息 上 )， 如 图 7-5 所 示 。 


#include «stdio.h» 


int main(void) 


@rintf ("There were sd arguments.\n", argc); 


if (argc .gt. 5) then 
print *, 'You seem argumentative today'; 
end if 


return 0; 





图 7-$ ”光标 位 于 第 一 个 错误 上 
修复 这 个 错误 后 ， 有 两 种 方式 前 进 到 下 一 个 错误 。 
口 可 以 重 做 程序 ，Vim 会 再 次 显示 其 余 和 警告 和 错误 ， 并 将 光标 重新 放 到 第 一 个 错误 上。 这 种 
方式 适用 于 构建 时 间 可 以 忽略 不 记 的 情况 ， 尤 其 是 用 一 个 按键 构建 程序 时 ， 比 如 : 


au BufNewFile,BufRead *.c map «F1» :make«CR» 


a 也 可 以 使 用 显示 下 一 个 钳 误 或 警告 的 命令 :cnext。 类 似 地 ，: cprevious 显 示 上 一 个 错误 或 
警告 ，:cc 显 示 当 前 错误 或 警告 。 这 3 个 命令 都 很 方便 地 将 光标 放 在 “活动 ”错误 或 警告 
7.1.5 关于 将 文本 编辑 器 作为 IDE 的 最 后 一 个 考虑 事项 


虽然 精通 所 选择 的 编辑 器 是 不 言 自 明 的 ， 以 致 人 们 往往 会 忽略 这 一 点 ， 但 这 确实 是 学 习 在 特 
定 环 境 下 编程 的 第 一 步 。 点 不 夸张 地 说 ,编辑 器 对 于 程序 员 ， 束 好 比 乐器 对 于 首 乐 家 。 即 使 是 最 
富有 创造 性 的 作曲 家 ， 也 需要 知道 阐 奏 乐器 的 基本 知识 ， 才 能 实现 他 们 的 想法 ， 使 其 他 人 受 惠 。 
最 大 限度 地 学 会 使 用 编辑 器 可 以 更 迅速 地 编写 程序 ， 更 有 效 地 领悟 其 他 人 的 代码 ， 并 减少 调试 代 
码 时 需要 执行 的 编 详 次 数 。 

如 果 使 用 的 是 Vim， 我 们 推荐 你 看 看 Steve OuallinePrz& HJ Vi IMproved—Vim (New Riders, 
2001) . XX. AMBAS. (但 是 ， 它 是 为 Vim 6.0 编 写 的 ，Vim 7.0 及 其 后 版 本 的 
折 车 等 功能 没有 包括 进去 。) 我 们 这 里 的 目标 只 是 初步 了 解 一 下 Vim 能 够 为 程序 员 做 的 事 , 但 Steve 
的 著作 是 学 习 具 体 知识 的 极 佳 资 源 。 

作者 发 现 Vim 有 很 多 特别 有 用 的 功能 。 比 如 ， 本 来 我 们 还 想 讨论 : 

a 用 kK 但 询 手册 页 面 中 的 函数 ; 

a 用 gd 和 gD 查找 变量 声明 ， 

a 用 [^pD 和 ]^D 跳 到 宏 定义 ; 

a 用 ]d、]d、[D 和 ]D 显 示 宏 定义 ; 

O 划分 窗口 以 同时 查看 .c 和 .h 文 件 ， 以 便 检查 原型 ; 

口 其 他 种 种 。 

但 是 本 书 是 关于 调试 的 ， 而 不 是 关于 Vim 的 。 下 面 继续 讨论 其 他 软件 工具 。 
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7.2. 元 分 利用 编译 器 


如 果 说 编辑 右 是 对 抗 程序 错误 的 第 一 个 武 右 ， 那么 编译 占 束 是 第 二 个 武器 。 所 有 编译 占 都 有 
能 力 扫 摘 代 码 并 查找 常见 错误 ， 但 是 通常 必须 通过 调用 适当 的 选项 来 启用 这 种 错误 检查 。 
除了 一 些 特殊 情况 ， 很 多 编译 器 警告 选项 〈 比 如 GCC 的 -wWtraditional 开 关 ) 都 显得 有 些 大 
材 小 用 。 然 而 ， 在 任何 时 候 ， 不 使 用 -wal1 而 使 用 GCC， 最 好 连 这 样 的 想法 都 不 要 有 。 例 如 ， 痢 
手 C 程 序 员 最 常 犯 的 错误 可 以 通过 如 下 语句 说 明 。 
if (a = b) 
printf("Equality for all!\n"); 


这 是 有 效 的 C 代 码 ，GCC 会 顺利 地 编译 它 。 变 量 a 补 赋予 值 b， 而 且 这 个 值 用 在 条 件 语句 中 。 












































然而 ， 这 肯定 不 是 程序 员 的 意思 。 使 用 GCC 的 -Wall 切换 ， 至 少 可 以 得 到 一 条 警报 ， 指 出 这 段 代 
但 可 能 有 错误 。 
$ gcc try.c 


$ gcc -Wall try.c 
try.c: In function "main': 
try.c:8: warning: suggest parentheses around assignment used as truth value 


GCC 建议 在 作为 真正 的 值 使 用 之 前 ， 将 赋值 语句 a=b 加 上 括号 ， 与 在 赋值 并 执行 如 下 比较 时 
采用 的 方式 一 样 : if ((fp = fopen("myfile", "w")) == NULL)。GCC 实 际 上 在 问 :“ 你 确认 这 
里 是 要 赋值 as=b， 而 不 是 进行 a==b 的 测试 吗 ? " 

应 该 总 是 使 用 编 详 喜 的 错误 检查 选项 。 如 末 你 在 教授 编程 诗 ， 也 应 当 要 求学 生 使 用 这 样 的 选 
项 ， 以 便 逐 渐 灌 输 民 好 的 习惯 。GCC 用 户 应 当 总 是 使 用 -wall1， 即 使 在 最 小 的 “Hello, world! " 
程序 中 也 是 如 此 。 我 们 发 现 ， 也 要 愤 用 -Wmissing-prototypes 和 -Wmissing-declarations。 实 际 
上 ， 如 果 你 有 10 分 钟 的 容 余 时 间 ， 可 以 浏览 一 下 GCC 的 手册 页 面 ， 并 读 一 下 编译 絮 警 告 部 分 ， 特 
别 是 要 在 Unix 下 编程 时 ， 很 有 必要 。 


7.3 C 语言 中 的 错误 报告 


C 语 言 中 的 错误 报告 是 使 用 名 为 errno 的 老式 机 制 完成 的 。 虽然 errno 有 点 老 态 ， 而 且 有 一 些 
不 足 之 处 ， 但 是 一 般 都 能 完成 工作 。 你 可 能 会 想 ， 既 然 大 部 分 C 函 数 都 有 方便 的 返回 值 ， 可 以 表 
明 调 用 是 成 功 还 是 失败 , 为 什么 需要 错误 报告 机 制 呢 ?答案 是 返回 值 可 以 提示 你 一 个 函数 没有 做 
ks EB EM, 但 是 它 可 能 会 也 可 能 不 会 告诉 你 为 什么 。 为 了 更 上 其 体 地 说 明 ， KAU PIRA 
E. 

FILE «fp 


fp = fopen("myfile.dat", "r"); 
retval = fwrite(&data, sizeof(DataStruct), 1, fp); 


假说 你 租 看 retval 并 发 现 它 等 于 0。 从 手册 页 面 上 看 到 fwrite() 应 返回 编号 的 项 数 〈 不 是 字 
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节 或 字符 数 )， 因 此 retval 应 为 1。fwrite() 会 有 多 少 种 失败 的 方式 ?很 多 ! 首先 ， 该 文件 可 能 
满 , 或 者 你 可 能 没有 在 文件 上 写 权 限 。 然而 , 在 本 例 中 , 代码 中 有 导致 fwrite() 失 败 的 程序 错误 。 
你 能 找 出 这 个 程序 错误 吗 ?“ 像 errno 这 样 的 错误 报告 系统 可 以 提供 诊断 信息 , 帮 你 找 出 在 这 样 的 
情况 下 及 生 了 什么 事 。( 操 作 系统 也 可 能 宣告 菜 些 销 误 。) 
使 用 errno 

系统 与 库 调 用 的 失败 通常 会 设置 一 个 名 为 errno 的 全 局 定义 整数 变量 。 在 大 多 数 GNU/ Linux 
系统 上 ，errno 是 在 ppszAzcludeerrzo.1 上 声明 的 ， 因 此 ， 包 括 了 这 个 头 文 件 ， 就 不 必 在 源 代码 中 
声明 extern int errno. 

当 一 个 系统 或 库 调用 失败 时 ， 筷 将 errno 设 置 为 一 个 指示 失败 区 型 的 值 。 检 码 errno 的 什 ， 并 
采取 适当 的 动作 是 你 的 职员 。 来 看 代 公 清单 7-2。 


代码 清单 7-2  double-trouble.c 


#include <stdio.h> 
#include «errno.h» 
#include <math.h> 




















int main(void) 
1 
double trouble - exp(1000.0); 
if (errno) ( 
printf("trouble: %f (errno: %d)\n", trouble, errno); 
exit(-1); 


} 


return 0; 


} 


在 我 们 的 系统 上 ，exp(1666.6) 能 够 存储 的 值 比 double 类 型 存储 的 值 大 ， 因 此 赋值 导致 浮 点 
洲 出 。 从 输出 中 可 以 看 出 ，errno 的 值 34 表 示 浮 点 次 出 错误 。 


$ ./a.out 
trouble: inf (errno: 34) 


XIR AFERE EUCH] Y erenol] LVF ASK. Tid Top], PERRO RM AR ZUR FRI, EK errno 
设置 为 一 个 摘 述 调用 失败 原因 的 值 。 从 上 面 的 代码 中 看 到 ， 值 34 意 味 看 exp(18886.8) 的 结束 不 能 
用 double 值 表示 ， 还 有 其 他 很 多 值 表示 下 洲 、 权 限 问 题 、 文 件 未 找到 等 等 错误 情况 。 然 而 ， 在 程 
序 中 开始 使 用 errno 之 前 ， 需 要 注意 一 些 问 题 。 

站 和 完 ， 使 用 errno 的 代码 可 能 不 是 完全 可 移植 的 。 例 如 ，ISO C 标 准 仅 定 义 了 少量 错误 代码 ， 
POSIX 标 准 定 义 了 很 多 错误 代码 。 从 errno 手 册页 面 中 可 以 看 到 哪些 错误 代码 是 由 哪些 标准 定义 























QD 我 们 用 读 模 式 打 开 了 文件 ， 然 后 试图 向 其 中 写 信息 。 
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的 。 而 且 ， 这 些 标准 不 是 指定 的 像 34 这 样 的 数值 来 表示 针 误 代码 ， 而 是 规定 了 符号 错误 代码 ， 它 


们 是 一 些 以 E 为 前 级 的 


Fe AS Ed, 


A ra EEL 


在 errno 头 文件 中 定义 (或 者 在 errno 头 文件 所 包括 的 文件 中 ) 。 








符号 错误 代码 的 值 在 不 同 平 台 上 的 唯一 一 致 之 处 是 它们 都 是 非 零 值 。 因 此 ,不 能 假定 某 个 特定 的 
值 总 是 表示 相同 的 错误 情况 。 "应 该 总 是 使 用 符号 名 指 代 errno 值 。 

除了 ISO 和 POSIX errno 值 外 ，C 库 的 特定 实现 《比如 GNU 的 glibc) 其 全 可 以 定义 更 多 errno 
fi. YEGNU/Linux 上 ，libc 的 信息 页 面 ? 的 errno 部 分 是 该 平台 上 所 有 可 用 errno 值 的 规范 来 源 : 
ISO, POSIX#ilglibc. F F411) GNU/Linux Las E peN HOR A /usr/include/asm/errno.hF Hy is 


TER RIIDE X o 
#define EPIPE 32 
#define EDOM 33 
#define ERANGE 34 
#define EDEADLK 35 
#define ENAMETOOLONG 36 
#define ENOLCK 37 
#define ENOSYS 38 


/* 
/* 
/* 


Broken pipe */ 

Math arg out of domain of func */ 
Math result not representable +/ 
Resource deadlock would occur +*/ 
File name too long */ 

No record locks available x/ 
Function not implemented */ 


接 下 来 ， 关 于 errno 用 法 还 有 一 些 要 点 要 记 住 。errno 可 以 通过 任何 库 函 数 或 系统 调用 设置 ， 
无 论 它 是 成 功 还 是 失败 ! 因为 成 功 的 函数 调用 也 能 够 设置 errno， 上 所 以 不 能 依赖 errno 告 诉 你 是 合 
只 能 依赖 它 指出 为 什么 发 生菜 个 错误 。 因 此 ， 使 用 errno 最 安全 的 方式 如 下 。 
(1) 执行 对 库 或 系统 函数 的 调用 。 
(2) 使 用 函数 的 返回 值 判 断 是 否 发 生 了 某 个 错误 。 
(3) 如 果 发 生 了 某 个 错误 ， 使 用 errno 人 确定 为 什么 发 生 这 个 错误 。 


发 生 了 错误 。 











用 伪 码 表示 如 下 。 





retval = systemcall(); 

if (xetval indicates an error) { 产生 错误 
examine errno(); 检查 错误 代号 
take action(); 采取 行动 














然后 要 用 到 手册 页 面 。 假设 你 在 编码 , 要 在 调用 ptrace() 后 抛 出 一 些 错误 检 奏 。 第 二 步 表 示 ， 
使 用 ptrace() 的 返回 值 来 确定 有 没有 发 生 某 个 错误 。 如 末 你 像 我 们 一 样 做 ,就 不 必 记 住 ptrace() 
的 返回 值 。 可 以 怎么 做 呢 ? 每 个 手册 页 面 都 有 一 个 名 为 Return Value 的 部 分 。 可 以 快速 来 到 这 个 
页 面 ， 键 入 man function name 来 搜索 字符 串 return value. 

虽然 errno 有 一 些 缺 陷 ， 但 也 有 一 些 优势 。 























GNU 库 在 货 后 需 做 大 量 工作 ， 当 进入 函数 时 你 存 errno， 然 后 如 朵 函数 调用 成 功 ， 将 它 恢复 





CD 例如 ， 有 些 系统 中 EWOULDBLOCK 与 EAGAIN 是 不 同 的 ， 但 是 GNU/Linux 对 这 两 者 不 加 区 别 。 
© 除了 lilbc 信 息 页 面 外 ， 也 可 以 在 系统 头 文件 中 查看 errno 值 。 这 样 不 仅 安全 而 且 自 然 ， 实 际 上 我 们 鼓励 这 样 做 ! 
© 在 代码 清单 7-2 中 对 errno 的 使 用 不 是 好 的 做 法 。 
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为 原始 值 。 如 果 函 数 调用 成 功 ，glibc 函 数 一 般 不 会 重 写 errno。 然 而 ，GNU 还 没有 完全 普及 ， 因 
此 可 移植 代码 不 应 依赖 于 这 一 事实 。 

另外 ， 虽 然 每 次 要 三 看 特定 钳 误 代码 时 都 过 一 过 文档 太 震 琐 ,但 是 有 两 个 函数 使 得 错误 代 但 
的 解释 更 容易 : perror() 和 strerror()。 虽 然 它们 做 的 事情 相同 ， 但 是 方式 不 同 。perror() 函 数 
接受 字符 串 参 数 ， 且 没有 返回 值 。 

#include <stdio.h> 

void perror(const char +s); 























perror() 的 参数 是 用 户 提 供 的 字符 串 。 当 调用 perror() 时 ， 它 输出 这 个 字符 串 ， 后 面 跟 独 一 
个 冒号 和 空格 ， 然 后 是 基于 errno 的 值 进 行 的 错误 类 型 描述 。 代 码 清 单 7-3 是 一 个 关于 如 何 使 用 
perror() 的 简单 示例 。 





代码 清单 7-3 perror-example.c 


int main(void) 
{ 
FILE «fp; 


fp = fopen("/foo/bar", "r"); 


if (fp == NULL) 
perror("I found an error"); 


return 0; 
} 
如 果 系 统 上 没有 文件 /foo/bar， 输 出 如 下 所 示 。 
$ ./a.out 


I found an error: No such file or directory 


perror() H4] Hz — “Son Bt eo UN ROR AEP BA f en t HR XE EAA FR, m EK 


FA TR errn RA VE Vd TETH RT] PRICE strerror() « 


include <string.h> 
char xstrerror(int errnum); 








这 个 函数 将 errno 的 值 作 为 其 参数 ， 并 返回 一 个 描述 错误 的 字符 串 。 代 码 清 单 7-4 是 一 个 关于 
如 何 使 用 strerror() 的 示例 。 


代码 清单 7-4  strerror-example.c 


int main(void) 
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i 
close(5); 


printf("%s\n", strerror(errno)); 
return 0; 


) 
该 程序 的 输出 如 下 。 


$ ./a.out 
Bad file descriptor 


7.4 更 好 地 使 用 strace 和 ltrace 


了 解 库 防 数 和 系统 调用 之 间 的 区 别 很 重要 。 库 函数 是 更 忆 级 别 的 ， 完 全 在 用 户 容 间 里 运行 ， 
并 为 程序 员 提 供 了 到 做 实际 工作 (系统 ) 的 函数 的 更 方便 的 接口 。 系 统 调用 代表 用 户 以 内 核 模式 
工作 ， 由 操作 系统 本 和 映 的 内 核 提 供 。 库 函数 printf() 看 上 去 类 似 于 一 般 输 出 函数 ,但 是 它 实 际 上 
只 是 格式 化 你 提供 给 字符 串 的 数据 ， 并 用 低级 系统 调用 write() 编 写字 人 符 串 数 据 ， 然 后 将 数据 友 
送 到 一 个 与 终端 的 标准 输出 关联 的 文件 中 。 

strace 实 用 程序 输出 程序 进行 的 各 个 系统 调用 及 其 参数 和 返回 值 。 如 果 想 查看 printf() 进 行 
了 哪些 系统 调用 ， 很 容易 做 到 。 编 写 一 个 “Hello, world! ”程序 ， 按 如 下 代码 运行 它 。 



































$ strace ./a.out 











计算 机 很 努力 地 工作 ， 只 是 为 了 回 屏 幕 上 显示 一 些 内 容 。 

strace 输 出 的 每 一 行 对 应 于 一 个 系统 调用 。strace 的 大 多 数 输出 显示 了 对 mmap() 和 open() 的 
调用 ， 采 用 类 似 1d.so 和 1ibc 这 样 的 文件 名 。 它 们 与 一 些 系统 级 操作 有 关 ， 比 如 将 磁盘 文件 映射 到 
内 存 中 及 加 载 共享 库 等 。 一 般 来 说 不 必 关 心 所 有 系统 操作 。 对 于 我 们 而 言 ， 只 要 关心 靠近 输出 末 
尾 的 两 行 即 可 。 











write(1, "hello world\n", 12hello world) = 12 
_exit(0) = ? 


这 些 代 码 行 说 明了 strace 输 出 的 一 般 格式 : 

O 被 调用 的 系统 函数 名 ; 

a [ifs c SEIT) ZR ie Hed SG 

a = 号 后 面 的 系统 调用 "返回 值 。 

MAE, BEARRA AAH E! 你 也 可 以 发 现 错误 。 比 如 ， 在 我 们 的 系统 上 ， 得 到 如 
下 代码 行 。 





open("/etc/ld.so.preload", O RDONLY) = -1 ENOENT (No such file or directory) 








Q 或 许 你 会 吃惊 地 发 现 exit() 的 返回 值 是 问号 。 这 里 strace 只 是 要 表明 _exit 返 回 了 一 个 void 值 。 
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open("/etc/ld.so.cache", O RDONLY) = 3 


第 一 次 调用 open() 是 为 了 打开 名 为 /etc/q.so.preload 的 文件 。 对 open() 的 调用 得 到 的 返回 值 
(应 当 是 非 负 的 文件 描述 符 ) 是 -1， 说 明 出 现 了 有 某 种 错误 。Strace 热 心地 告诉 我 们 导致 open() 失 
败 的 错误 是 ENOENT: 文件 /etc/d.so.preload 不 存在 。 

strace 告 诉 我 们 ， 对 open() 第 二 次 调用 的 返回 值 为 3?。 这 是 一 个 有 效 的 文件 摘 述 符 ， 因 此 显 
然 打 开 文 件 /etcMdso.cacjpne 的 调用 成 功 了 。 相 应 地 ，strace 输 出 的 第 二 行 上 没有 钳 误 代码 。 

顺便 说 一 下 ， 不 要 担心 像 这样 的 错误 。 你 看 到 的 内 容 与 动态 库 加 载 有 关 ， 本 质 上 并 不 是 真正 
的 错误 。 文 件 /so.preload 可 用 来 重 写 系统 的 默认 共享 库 。 由 于 我 无 意 纠 绰 这 些 事情 ， 所 以 该 文 
件 根 本 不 在 我 的 系统 上 。 当 你 逐渐 获得 strace 的 经 验 时 , 就 会 越 来 越 恒 得 如 何 过 滤 挥 这 种 “ 品 首 ”， 
将 精力 集中 于 真正 感 兴趣 的 输出 部 分 。 

strace 有 一 些 需 要 在 某 个 时 候 使 用 的 选项 , 因此 我 们 这 里 简单 地 介绍 一 下 。 看 一 下 “Hello, world!” 
程序 的 完整 strace 输 出 ， 可 能 注意 到 strace 有 一 点 见长 。 将 所 有 输出 保存 在 一 个 文件 中 比试 图 在 
屏幕 上 和 奉 看 要 方便 得 多 。 当 然 ， 可 以 使 用 重 定 癌 stderr 的 方式 ， 但 是 也 可 以 用 -o LogfiLe 开 关 ， 
使 strace 将 其 所 有 输出 都 号 到 一 个 日 访 文件 中 。 另 外 ，strace 一 般 将 字符 串 帘 短 为 32 个 字符 。 这 
一 特性 有 时 会 隐 蔬 重要 信息 。 为 了 强制 strace 将 学 符 串 规 短 为 N 个 字符 ， 可 以 使 用 -s N 选 项 。 最 
后 ,， 如果 在 具有 子 进 程 分 支 的 程序 上 运行 strace, 可 以 用 -o Loa -ff 开关 , 将 单个 子 进程 的 strace 
输出 捕获 到 一 个 名 为 COG.xxx 的 文件 中 ， 其 中 xxx 是 子 进程 ID。 

还 有 一 个 名 为 ltrace 的 实用 工具 ， 它 类 似 于 strace， 但 它 显 示 了 库 调 用 而 不 是 系统 调用 。 
ltrace 和 strace 有 很 多 共同 的 选项 ， 因 此 知道 如 何 使 用 其 中 一 个 ， 就 很 容易 学 会 使 用 另 一 个 。 

当 你 不 具有 源 代 人 码 (甚至 具有 源 文 件 ) 时 , 如 果 要 癌 维 护 人 员 发 送 程序 错误 报告 和 诊断 信息 ， 
strace 和 1trace 实 用 程序 非常 有 用 ， 使 用 这 些 工 具有 时 比 深度 调试 代码 更 快 。 

本 书 作者 之 一 试图 在 他 自己 的 系统 上 安装 并 运行 一 个 文档 不 全 的 专 有 应 用 程序 时 , 偶尔 发 现 
了 这 些 工 具 的 有 用 性 。 当 局 动 时 ， 似 乎 不 需要 做 任何 事情 ， 应 用 程序 就 立即 返回 到 shell。 他 想 问 
公司 发 送 一 些 比 仅仅 报告 “你 的 程序 即将 退出 ”所 含 信 息 更 丰富 的 内 容 。 在 该 应 用 程序 上 运行 
strace 产 生 了 一 个 线 系 : 


open(umovestr: Input/output error 0，0 RDONLY) = -1 EFAULT (Bad address) 
运行 Itrace 产 生 了 更 多 线索 : 
fopen(NULL, "r") = 0 


从 和 输出 中 可 以 发 现 ， 这 是 对 fopen() 的 第 一 次 调用 。 应 用 程序 大 概 想 打 开 某 种 配置 文件 ， 但 
是 传递 给 fopen() 的 是 NULL。 应 用 程序 有 某 种 内 部 错误 处 理 程 序 ， 退 出 但 是 不 产生 错误 消息 。 这 
位 作者 因此 癌 公 司 发 送 了 详细 的 程序 错误 报告 , 而 事实 证 明 ， 问题 在 于 应 用 程序 配备 了 错误 的 全 
局 配置 文件 ， 它 指 问 了 一 个 不 存在 的 局 部 配置 文件 。 第 二 天 公司 束 发 布 了 一 个 补丁 。 

从 那 以 后 , 我 们 两 位 作者 发 现 strace 和 1trace 对 于 跟踪 程序 错误 和 解决 雯 手 日 会 引起 很 多 麻 
烦 的 奇怪 行为 非常 有 用 。 
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7.5 静态 代码 检查 器 : lint 与 其 衍生 


市 面 上 有 很 多 扫描 代码 的 免费 或 商业 工具 ， 不 编译 代码 ， 仅 仅 警 告 错 误 、 可 能 的 错误 和 与 严 
格 C 语 言 编 码 标准 的 差距 , 这 样 的 工具 称 为 静态 代码 检查 器 。C 语 言 的 规范 静态 代码 检查 堪 由 S.C 
Johnson 在 20 世 纪 70 年 代 末 编写 ， 称 为 lint。 编 写 lint 主 要 是 为 了 检查 函数 调用 ， 因 为 C 语 言 的 早 
期 版 本 不 支持 原型 。1int 产 生 了 很 多 衍生 静态 检查 器 。 其 中 之 一 由 美国 弗吉尼亚 大 学 计算 机 科学 
系 的 Dave Evans 编 瑟 ， 名 为 lclint， 在 Linux 等 现代 系统 上 广泛 使 用 。2002 年 1 月 ，Dave 将 lclint 
改名 为 splint， 以 强调 对 安全 编程 的 重视 (也 因为 splint 比 lcint 更 容易 拼 读 )。 

splint 的 目标 是 帮助 编写 最 具 防 御 性 、 安 全 和 无 错 的 程序 。splint 像 它 的 前 身 一 样 ， 对 于 组 
成 有 效 代 码 的 内 容 非 常 挑剔 。 “作为 练习 ， 试 找 出 代码 清单 7-$ 中 可 能 引起 警告 的 内 容 。 


代码 清单 7-5  scan.c 


int main(void) 


i 












































int i; 
scanf ("%d", &i); 


return 0; 


} 
当 通 过 splint 运 行 代 码 时 ， 发 出 一 条 警告 ， 表 示 即 将 丢弃 scanf() 的 返回 值 。” 


$ splint test.c 
Splint 3.0.1.6 --- 11 Feb 2002 





test.c: (in function main) 

test.c:8:2: Return value (type int) ignored: scanf(" 4d", &i) 
Result returned by function call is not used. If this is intended, can cast 
result to (void) to eliminate message. (Use -retvalint to inhibit warning) 


Finished checking --- 1 code warning 


所 有 splint 和 警告 都 有 固定 格式 。splint 和 警告 的 第 一 行 指出 发 生 和 警告 的 文件 名 和 函数 。 下 面 一 
行 提供 了 和 警告 的 行 号 和 位 置 。 接 看 是 警告 的 描述 ,以 及 关于 如 何 抑制 这 种 警告 的 说 明 。 可 以 看 到 ， 
调用 splint -retvalint test.c 关 闭 所 有 关于 丢弃 整数 函数 返回 值 的 党 告 。 男 外 ， 如 果 不 想 关闭 
所 有 关于 被 于 人 弃 的 int 返 回 值 的 报告 , 可 以 通 过 将 scanf() 的 类 型 强制 转换 成 void 来 抑制 对 scanf() 
的 这 一 调用 的 敬告。 也 束 是 用 (void) scanf("%d"，&i); 和 穴 换 scanf("%d"，&i);。 (还 有 男 一 种 
抑制 这 种 警告 的 办 法 ， 即 使 用 注解 ， 感 兴趣 的 读者 可 参见 splint 文 档 了 解 评 情 。) 



































(D 很 多 程序 员 将 splint 没 有 报告 警告 看 作 一 种 极 大 的 荣誉 。 当 出 现 这 种 情况 时 ， 代 码 倍 声明 为 无 lint 的 。 
(2 scanf() 的 返回 值 是 指定 的 输入 项 数 。 
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7.5.1 如 何 使 用 splint 


splint 有 很 多 开关 , 但 是 在 使 用 时 能 感 党 到 哪些 开关 能 满足 需要 。 很 多 开关 本 质 上 是 布尔 值 : 
它们 打开 或 关闭 茶 个 功能 。 在 这 些 类 型 鸭 开 关 前 面 加 上 + 吏 将 它们 打开 ， 加 上 -就 将 它们 关闭 。 例 
如 ，-retvalint 关 财 被 丢弃 的 jnt 返 回 值 的 报告 ，+retvalint 打 开 这 个 报告 (这 是 默认 行为 〉。 

有 了 两 种 使 用 splint 的 办 法 。 第 一 种 是 非 正 式 的 ， 主 要 用 在 针对 其 他 人 的 代码 或 即将 完成 的 代 
伺 运 行 splint 时 。 























$ splint «weak *.c 





如 果 没 有 +weak 开 关 ，splint 通 常 因为 太 挑剔 而 用 处 不 大 。 除 了 +weak 外 ， 还 有 3 种 级 别 的 检 
租 。 人 参见 splint 手 册 了 解 关 于 它们 的 更 多 信息 ， 这 里 傈 述 如 下 : 

O «weak, JIRA, XE 8)H T 7G RET] CAN; 

Q «standard, EAU Bis. 

O «checks, PERRA; 

Q +fstrict， 高 度 严 格 检 查 。 

splint 的 更 正式 的 用 途 涉 及 对 专门 与 splint 一 起 使 用 的 代码 进行 文档 记录 。 这 种 splint 特 有 
的 文档 称 为 注解 Cannotation) 。 注 解 是 一 个 大 主题 ， 本 书 没 有 足够 的 篇 幅 来 介绍 ， 但 是 可 以 参 
见 splint 文 档 了 解 话 细 信 息 。 


7.5.2 A 后 注意 意 事 项 


splint 文 持 很 多 《〈 但 不 是 全 部 ) C99 库 扩展 。 扬 也 不 文 持 部 分 C99 语 言 变化 。 例 如 ，splint 
不 能 处 理 复杂 数据 类 型 ， 也 不 知道 如 何在 for 循 环 的 初始 化 乾 中 定义 int 变 量 。 
splint 是 在 GNU GPL 下 发 布 的 ， 其 主页 为 http:/Wwww.splint.org/。 


7.6 ”调试 动态 分 配 的 内 存 


你 可 能 知道 ， 动 态 分 配 的 内 存 (Dynamically Allocated Memory, DAM) 是 程序 用 malloc() 
和 calloc() 这 样 的 函数 从 堆 中 请 求 的 内 存 。" 动 态 分 配 的 内 存 通常 用 于 二 又 树 和 链表 等 数据 结构 ， 
在 面 问 对 象 编程 中 创建 对 象 时 ， moet Le 甚 全 标准 C 语 言 库 在 内 部 也 使 用 DAM。 
你 还 可 能 记得 ， 处 理 完 后 必须 释放 动态 内 存 。 

众所周知 ，DAM 问 题 相 当 难 奋 找 ， 分 为 以 下 几 类 。 

a 没有 释放 动态 分 配 的 内 存 。 

a 对 malloc( ) 的 调用 失败 (这 容易 通过 检 枉 malloc() 的 返回 值 来 检测 )。 

a 咎 DAM 段 之 外 的 地 址 执行 读 和 写 操 作 。 





























Q 在 本 市 其 余部 分 ， 我们 仪 提 及 malloc()， 但 实际 上 表示 malloc() 及 其 类 似 函 数 ， 比 如 calloc() 和 realloc()。 
D 一 个 值得 注意 的 例外 是 allocal() 函 数 ， 它 从 当前 栈 帧 请 求 动态 内 存 ， 而 不 是 从 堆 请 求 。 当 该 函数 返回 时 ， 自 动 释 
放 帧 中 的 内 存 。 因 此 ， 你 不 必 释 放 alloca() 所 分 配 的 内 存 。 
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O 释放 DAM 段 之 后 对 DAM 区 域 中 的 内 存 执行 读 写 操作 。 

O 对 动态 内 存 的 同一 段 调用 两 次 free()。 

这 些 错误 可 能 不 会 导致 程序 以 明显 的 方式 月 波 。 让 我 们 进一步 讨论 这 个 问题 。 为 了 具体 说 明 
这 些 问 题 ， 来 看 代码 请 单 7-6。 


代码 清单 7-6 memprobs.c 


int main( void ) 

i 
int *a = (int *) malloc( 3*sizeof(int) ); // malloc return not checked 
int «xb = (int *) malloc( 3*sizeof(int) ); // malloc return not checked 








for (int i = -1; i <= 3; ++i) 
ali] = i; // a bad write for i = -1 and 3 


free(a); 
printf("%d\n", a[1]); // a read from freed memory 
free(a); // a double free on pointer a 


return 0; // program ends without freeing xb. 


} 
第 一 个 问题 称 为 内 存 泄漏 。 例 如 ， 来 看 代码 清单 7-7。 
代码 清单 7-7 Ara bl 





int main( void ) 


i 
... lots of previous code ... 
myFunction(); 
. lots of future code ... 
} 


void myFunction( void ) 


{ 


char *name = (char *) malloc( 10*sizeof(char) ); 


Í 


当 myFunction() 执 行 时 ， 为 10 个 char 值 分 配 内 存 。 引 用 这 个 内 存 的 唯一 办 法 是 通过 使 用 
malloc() 人 返回 的 地 址 (存储 在 指针 变量 name 中 )。 如 果 由 于 某 种 原因 丢失 了 这 个 地 址 ， 比 如 
myFunction() 退 出 时 name 超 出 了 作用 域 , 而 且 没 有 在 别 的 地 方 保存 其 值 的 副本 ,那么 束 没 有 办 法 
访问 分 配 的 内 存 ， 特 别 是 无 法 释放 它 。 
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但 这 正 是 这 段 代 码 中 发 生 的 事情 。 动 态 分 配 的 内 存 不 会 像 name 等 为 栈 分 配 的 存储 需 那 样 
简单 地 消失 或 超出 作用 域 ， 因 此 每 次 调用 myFunction() 时 ， 都 会 消耗 10 个 字符 的 内 存 ， 然 后 
永远 不 释放 。 最 终结 果 是 变量 堆 空 间 变 得 越 来 越 小 。 这 束 是 人 们 将 这 种 程序 错误 称 为 内 存 港 
漏 的 原因 。 

内 存 汇 漏 减少 了 程序 的 可 用 内 存 数 量 。 在 大 多 数 现代 系统 (比如 GNU/Linux) E, MFE 
内 存 泄漏 的 应 用 程序 终止 时 ， 操 作 系 统 会 回收 这 种 内 存 。 在 老 的 系统 上 【比如 Microsoft DOS 
和 Microsoft Windows 3.1)， 浊 漏 的 内 存 会 失去 ， 直 到 重 司 系统 才 会 回收 。 无 论 系 统 新 日， 内存 
浊 漏 都 会 导致 系统 性 能 下 降 ， 因 为 增加 了 分 页 操作 。 随 看 时 间 的 推移 ， 它 们 会 导致 有 内 存 泄 漏 的 
程序 甚至 整个 系统 骨 沉 。 

动态 分 配 内 存 迪 到 的 第 二 个 问题 是 对 malloc() 的 调用 可 能 失败 。 发 生 这 种 情况 的 方式 很 多 。 
例如 ， 计 算 中 的 程序 错误 可 能 导致 请 求 大 量 的 或 为 负 值 的 DAM。 或 者 ， 也 许 系统 内 存 真 的 用 完 
了 了。 如果 没 有 意识 到 发 生 了 这 个 问题 ， 而 继续 试图 在 你 误 以 为 有 效 的 DAM 上 该 写 ， 则 局 面 会 雪 
上 加 和 霜 。 这 是 一 种 我 们 很 快 融会 讨论 的 访问 违反 。 然 而 ， 为 了 避免 这 种 情况 ， 应 当 总 是 检 香 
malloc() 有 没有 返回 非 NULL 指 针 ， 如 果 没 有 返回 这 种 指针 ， 应 沦 试 优雅 地 退出 程序 。 

第 三 个 和 第 四 个 问题 称 为 访问 错误 。 这 商 个 问题 本 质 上 是 同一 件 事 情 的 不 同 版 本 : 程序 试图 
在 不 可 用 的 内 存 地 址 上 访 或 号 。 第 三 个 问题 涉及 访问 DAM 段 以 上 或 以 下 的 内 存 地 址 。 第 四 个 问 
题 涉及 访问 过 去 曾经 可 用 ， 但 是 在 访问 答 试 之 前 被 释放 了 的 内 存 地 址 。 

对 DAM 的 同一 个 段 调 用 两 次 free() 俗 称 为 重复 释放 (double ffee)。C 库 有 种 内 部 内 存 管 理 结构 
描述 分 配 的 每 个 DAM 段 边界 。 当 对 指 同 动态 内 存 的 同一 个 指针 两 次 调用 free() 时 ， 程 序 的 内 存 管 
理 结构 被 破坏 ， 导 人 臻 程序 朋 沉 ; 在 有 些 情 况 下 ， 甚 至 会 使 怀 有 恶意 的 程序 员 利 用 这 个 程序 错误 产生 
绥 冲 区 溢出 。 在 某 种 意义 上 ， 这 也 是 一 种 访问 违反 ， 但 这 是 针对 C 库 本 号 的 ， 而 不 是 针对 程序 的 。 

访问 违反 会 导致 发 生 这 两 件 事情 之 一 : 一 是 程序 骨 尝 ， 可 能 写 一 个 核心 文件 (通常 在 收 到 
段 错 误 信 号 后 ); 二 是 更 糟糕 的 情况 ， 程 序 能 够 继续 执行 ， 导 致 数据 损坏 。 

在 这 两 种 结果 中 ， 前 者 绝对 要 好 得 多 。 事 实 上 ， 有 很 多 可 用 的 工具 会 导致 每 当 检 测 到 DAM 
有 任何 问题 时 ， 程 序 发 生 段 错误 ， 并 转 储 核心 ， 这 胜 于 冒 第 二 种 情况 的 风险 ! 

你 可 能 会 问 :“ 我 到 底 为 什么 要 让 程序 发 生 段 错误 呢 ?”” 要 知道 ， 如 果 人 处 理 DAM 的 代码 中 有 
程序 错误 ， 那 么 让 它 朋 沉 是 一 件 求 之 不 得 的 事 CVery Good Thing), CUK IIIA ERE. A AE 
解 且 不 能 再 现 的 坏 行为 。 在 内 存 损 坏 的 影响 被 感觉 到 之 前 ， 可 能 很 长 时 间 都 不 被 注意 。 通 第 情况 
下 ， 这 个 问题 在 离 程序 错误 相当 远 的 程序 部 分 中 才 表 现 出 来 ， 所 以 非常 难以 跟踪 。 更 粳 糕 的 是 ， 
内 存 损 坏 会 导致 安全 性 被 破坏 。 已 知 的 会 导致 缓冲 区 溢出 和 重复 释放 的 应 用 程序 ,在 有 些 情 况 下 
会 被 恶意 黑客 用 来 运行 任意 代码 并 攻击 很 多 操作 系统 安全 漏洞 。 

另 一 方面 ， 当 程序 发 生 了 段 错 误 并 转 储 了 核心 文件 ， 可 以 对 核心 文件 执行 事后 检查 ， 了 解 导 
致 该 段 错误 的 精确 源 文 件 及 代码 行 号 。 这 是 更 好 的 捕获 程序 错误 的 方式 。 

简 言 之 ， 尽 快 捕获 DAM 问 题 极 其 重要 。 
































































































































CD 这 俗称 转 储 核心 。 
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7.6.1 检测 DAM 问 题 的 策略 


本 三 讨 论 Electric Fence， 这 是 对 分 配 的 内 存 地 址 实施 “栅栏 ”防护 功能 的 库 。 访 问 这 些 栅栏 
外 的 内 存 通 常会 导致 段 错 误 和 核心 转 储 。 本 节 还 会 讨论 两 个 GNU 工 具 mtrace() 和 MALLOC_CHECK_， 
它们 同 标 准 libe 分 配 函 数 中 添加 钩子 , 以 保持 关于 当前 分 配 内 存 的 记录 。 这 样 , libec 束 可 以 对 要 读 、 
写 或 释放 的 内 存 执行 检查 。 记 住 ， 在 使 用 儿 个 软件 工具 时 要 小 心 ， 每 个 工具 都 使 用 钧 子 进行 与 堆 
相关 的 函数 调用 ， 因 为 一 个 工具 可 以 在 已 经 安装 的 钩子 上 再 安装 一 个 钩子 。” 
7.6.2 Electric Fence 


Electric Fence 〈 即 EFence)， 是 Bruce Perens 在 1988 年 编写 ， 在 GNU GPL 许可 下 发 布 的 。 那 时 
他 在 Pixar 工 作 。 当 EFence 链 接 到 代码 中 时 ， 导 致 程 序 在 发 生 下 列 情况 之 一 时 立即 发 生 段 错误 并 转 
fit ER. 

D 在 DAM 边 界 之 外 执行 读 或 与 操作 。 

a 对 已 经 释放 的 DAM 执 行 读 或 写 操作 。 

a 对 没有 指 癌 malloc() 分 配 的 DAM 的 指针 执行 free() 〈 包 括 重 复 释 放 的 特殊 情况 )。 

让 我 们 来 看 如 何 使 用 Electric Fence 跟 踪 malloc() 问 题 。 请 看 代码 清单 7-8。 


代码 清单 7-8 outOfBound.c 



































int main(void) 
{ 


int xa = (int *) malloc( 2*sizeof(int) ); 


for (int i-0; i«-2; ++i) { 
ali] = i; 
printf("%d\n ", a[i]); 
} 


free(a); 
return 0; 


} 


虽然 程序 中 包含 原型 的 malloc() 程 序 错误 , 但 是 它 可 能 会 没有 抱 候 地 正 
没有 问题 地 运行 。” 





编 详 ,其 全 很 可 能 


zi 





(D 实际 上 ， 可 以 安全 地 一 起 使 用 mtrace() 和 MALLOC_CHECK_， 因 为 mtrace() 小 心地 保留 了 它 发 现 的 任何 现 有 钧 子 。 

D 如 果 从 GDB 中 运行 链接 了 EFence 的 程序 ， 而 不 是 在 命令 行 上 调用 它 ， 那 么 程序 会 发 生 段 错误 ,不 转 储 核 心 。 这 正 
合 你 意 ， 因 为 链接 到 EFence 的 可 执行 文件 的 核心 文件 会 很 大 ， 而 且 你 不 需要 核心 文件 ， 因 为 你 总 是 位 于 GDB 中 ， 
并 正果 着 发 生 段 错误 的 源 代 人 码 文件 和 行 吕 处 。 

(3) 这 不 意味 着 malloc() 溢 出 不 会 对 代码 造成 严重 破坏 ! 本 例 主 要 为 了 说 明 如 何 使 用 EFence。 在 实际 问题 中 ， 编 写 超 
出 数组 边界 的 代码 会 导致 一 些 严重 问题 ! 














图 灵 社 区 会 员 cindy282694 EF 尊重 版 权 


7.6 ”调试 动态 分 配 的 内 存 189 


$ gcc -g3 -Wall -std-c99 outOfBound.c -o outOfBound without efence -lefence 
$ ./outOfBound without efence 

0 

1 

2 


Pel Hes EAA a Nea — 7638 LP E AT BRE. MEA LA WIEN, (HIEHBEULH] 
这 个 程序 错误 本 喘 不 可 预知 ， 以 后 难以 确切 地 跟 踩 。 

现在 我 们 将 outofBound 与 EFence 链 接 并 运行 它 。 默 认 情 况 下 ，EFence 仪 捕获 对 动态 分 配 区 域 
的 最 后 一 个 元 素 之 外 的 读 或 写 操作 。 这 总 味 看 当 试 图 写 入 a[2] 时 outofBound 应 当 出 现 段 错 谋 。 

















$ gcc -g3 -Wall -std-c99 outOfBound.c -o outOfBound with efence -lefence 
$ ./outOfBound with efence 
Electric Fence 2.1 Copyright (C) 1987-1998 Bruce Perens. 
0 
1 
Segmentation fault (core dumped) 


果然 ，EFence 发 现 写 操作 超过 了 数组 的 最 后 一 个 元 素 。 

虽然 不 小 心 访问 数组 第 一 个 内 存 之 前 的 内 存 〈 比 如 指定 “元 素 ”a[-1]) BUTS DU ANS 
见 ， 但 是 铺 误 的 索引 计算 可 能 会 导致 这 样 的 情况 。EFence 提 供 了 一 个 名 为 EF_PROTECT_ 
BELOW 的 全 局 int 变 量 。 当 将 这 个 变量 设置 为 1 时 ，EFence 仅 捕获 数组 下 游 ,不 检查 数组 上 洪 。 














extern int EF PROTECT BELOW; 


double myFunction( void ) 


i 
EF PROTECT BELOW - 1; // Check from below 
int xa = (int *) malloc( 2*sizeof(int) ); 
for (int i--2; i«2; +i) { 
ali] = i; 
printf("%d\n", a[i]); 
} 
} 


由 于 EFence 的 这 种 工作 方式 ,我 们 可 以 捕获 试图 访问 超出 动态 分 配 的 块 的 内 存 , 或 者 试图 访 
问 分 配 的 块 之 前 的 内 存 ， 但 古 不 能 同时 捕获 这 两 种 类 型 的 访问 错误 。 
为 了 更 彻底 地 捕获 程序 错误 ,应当 使 用 EFence 运 行程 序 两 次 : 一 次 在 默认 模式 下 检查 动态 内 
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存 上 溢 ， 另 一 次 将 EF_PROTECT_BELOW 设 置 为 1 来 检查 下 游 。? 

除了 EF_PROTECT_BELOW 外 ， 可 以 设置 FFence 的 另外 几 个 全 局 整 型 变量 ， 以 控制 其 行为 。 

口 EF_DISABLE_BANNER。 将 这 个 变量 设置 为 1 可 以 隐藏 运行 与 EFence 链 接 的 程序 时 显示 的 横 
幅 。 我 们 不 建议 这 样 做 ， 因 为 横幅 可 以 提醒 你 EFence 已 链接 到 应 用 程序 ， 不 应 将 可 执行 
文件 用 于 生产 版 本 ， 因 为 链接 到 EFence 的 可 执行 文件 较 大 ， 运 行 较 慢 ， 并 且 会 产生 非常 
大 的 核心 文件 。 

口 EF_PROTECT_BELOW。 正 如 我 们 讨论 过 的 ，EFence 默 认 检 查 DAM 上 洪 。 将 这 个 变量 设置 为 
会 使 EFence 检 查 内 存 下 汶 。 

O EF_PROTECT_FREE。 默 认 情 况 下 ，EFence 不 检查 对 已 被 释放 DAM 的 访问 。 将 这 个 变量 设置 
成 1 会 启用 对 已 释放 内 存 的 保护 。 

DEF_FREE_WIPES。 默 认 情 况 下 ，EFence 不 修改 存储 在 已 释放 内 存 中 的 值 。 将 这 个 变量 议 置 
成 非 零 值 导 臻 EFence 填 充 在 释放 前 用 6xbd 动 态 分 配 的 内 存 的 段 。 这 样 使 EFence 更 容易 检 
测 出 对 被 释放 的 内 存 的 不 当 访 问 。 

DEF_ALLON_MALLOC_6。 黑 认 情 况 下 ，EFence 会 捕获 对 malloc() 的 参数 为 0 的 任何 调用 〈 即 对 
零 字 布 内 存 的 任何 请 求 )。 其 基本 诛 理 是 编写 次 似 char *p = (char *) malloc(8); 的 代码 
可 能 是 程序 错误 。 然 而 ， 如 果 由 于 某 些 原因 ， 你 的 意思 真 的 是 癌 malloc() 传 递 0， 那 么 将 
这 个 变量 设置 为 非 零 值 会 使 EFence 忽 略 这 样 的 调用 。 

作为 练习 ， 请 编写 一 个 访问 已 释放 的 DAM 的 程序 ， 并 使 用 EFence 捕 获 这 一 错误 。 

每 当 修改 这 些 全 局 变量 之 一 时 ， 都 需要 重新 编译 程序 ， 这 很 不 方便 。 笠 好 还 有 一 种 更 容易 的 
方式 。 也 可 以 设置 与 EFence 的 全 局 变量 同名 的 shell 环 境 变 量 。EFence 会 检测 这 些 环境 变量 ， 并 采 
取 适 当 的 动作 。 

作为 示范 , 我 们 将 环境 变量 EF_DISABLE_BANNER 设 置 为 禁止 显示 EFence 横 幅 页 面 。( 正 如 以 前 
所 提 到 的 ， 你 不 应 这 样 做 。 ) 如 果 使 用 Bash， 执 行 : 


$ export EF DISABLE BANNER=1 



























































C shell 用 户 应 执行 : 

% setenv EF DISABLE BANNER 1 

然后 重新 运行 代码 清单 7-8， 并 确认 禁用 了 横幅 。 

另 一 个 技巧 是 在 调试 会 话 期 间 从 GDB 中 设置 EFence 变 量 。 这 样 之 所 以 可 行 ， 是 因为 EFence 
变量 是 全 局 的 。 然 而 ， 这 也 意味 着 程序 需要 在 执行 中 ， 却 被 暂停 了 。 
7.6.3 用 GNU C 库 工具 调试 DAM 问 题 

如 果 使 用 的 是 GNU 平 台 ， 比 如 GNU/Linux， 那 么 可 以 用 一 些 GNU C 库 特有 的 功能 (类 似 于 























i) 


CD 欲 知 详情 , 请 
Program” 部 


参阅 EFence 的 手册 页 面 的 “Word-Alignment and Overrun Detection” 和 “Instructions for Debugging Your 
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EFence) 来 捕获 动态 内 存 问 题 并 修复 。 我 们 下 面 简单 介绍 一 下 。 


1. MALLOC_CHECK_Environment 变 量 

GNU C 库 提供 了 一 个 名 为 MALLOC_CHECK_ 的 环境 变量 ， 像 EFence 一 样 ， 可 用 来 捕获 DAM 访 问 
违反 ， 但 是 对 它 的 使 用 不 需要 重新 编译 程序 。 这 些 设置 及 其 效果 如 下 所 示 。 

D 6 一 一 关闭 所 有 DAM 检 查 〈 如 果 没 有 定义 变量 ， 也 是 这 种 情况 )。 

a 1 一 一 当 检 测 到 堆 损坏 时 ， 显 示 关 于 stderr 的 诊断 消息 。 

a 2 一 一 当 检 测 到 堆 损 坏 时 ， 立 即 退 出 程序 并 转 储 内 存 。 

a 3 一 一 1 和 2 的 综合 效果 。” 

由 于 MALLOC_CHECK_ 是 环境 变量 ， 因 此 使 用 它 得 找 与 扒 相 关 的 问题 很 简单 ， 只 要 键入 如 下 代 
人 码 即 可 : 


$ export MALLOC CHECK =3 























A 


虽然 MALLOC_CHECK_ 比 EFence 用 起 来 更 方便 , 但 是 它 有 几 个 严重 的 缺陷 。 第 一 , MALLOC. CHECK - 
仅 在 下 次 执行 与 扒 相 关 的 函数 《〈 比 如 malloc()、realloc() 或 free()) 时 出 现 非 法 内 存 访问 的 情 
况 下 才 报 告 动态 内 存 问 题 。 这 意味 着 你 不 仅 不 知道 有 问题 代码 的 源 文件 和 行 号 ， 而 且 经 稼 甚 至 不 
知道 是 哪个 指针 引起 了 问题 。 为 了 说 明 这 一 点 ， 来 看 代 但 请 单 7-9。 














代码 清单 7-9  malloc-check-0.c 


ı int main(void) 

» { 

3 int *p = (int *) malloc(sizeof(int)); 
4 int *q = (int *) malloc(sizeof(int)); 


for (int i-0; i«400; ++i) 
pli] = i; 


11 free(q); 
T free(p); 
13 return 0; 


14 } 
在 第 11 行 出 现 的 程序 异常 中 断 实 际 上 问题 友 生 在 第 7 行 。 分 析 一 下 核心 文件 可 以 确认 问题 位 
Fak, it ep kb. 


$ MALLOC CHECK =3 ./malloc-check-o 
malloc: using debugging hooks 





D 这 在 作者 的 系统 上 没有 文档 说 明 。 感 谢 Gianluca Insolvibile 阅 读 glibc 源 代码 并 发 现 这 个 选项 ! 
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free(): invalid pointer 0x8049680! 

Aborted (core dumped) 

$ gdb malloc-check-O core 

Core was generated by ^./malloc-check-O'. 
Program terminated with signal 6, Aborted. 
Reading symbols from /lib/libc.so.6...done. 
Loaded symbols for /lib/libc.so.6 

Reading symbols from /lib/ld-linux.so.2...done. 
Loaded symbols for /lib/ld-linux.so.2 

#0 0x40046a51 in kill () from /lib/libc.so.6 
(gdb) bt 

#0 0x40046a51 in kill () from /lib/libc.so.6 

#1 0x40046872 in raise () from /lib/libc.so.6 
#2  0x40047986 in abort () from /lib/libc.so.6 
#3 0x400881d2 in IO file xsputn () from /lib/libc.so.6 
#4 0x40089278 in free () from /lib/libc.so.6 

#5 Ox080484bc in main () at malloc-check-0.c:13 








在 调试 这 个 只 有 14 行 的 程序 时 ， 你 还 能 够 应 付 这 一 缺 聊 ,但 是 当 使 用 真正 的 应 用 程序 时 ， 这 

可 能 是 一 个 严重 问题 。 然 而 ， 知 道 DAM 问 题 存 在 ， 这 本 身 是 一 个 有 用 信息 。 
其 次 ， 这 暗示 了 如 果 访 问 错误 发 生 后 没有 调用 与 堆 相 关 的 函数 ， 那 么 MALLOC_CHECK_ 根 本 不 

全 报告 错误 ， 

再次 ，MALLOC_CHECK_ 铺 误 消 息 似 乎 含义 不 是 那么 明显 。 虽 然 前 面 的 代码 清单 有 一 个 数组 上 
溢 错 误 ， 但 是 这 个 错误 消息 仅仅 指出 是 “无 效 指 针 ”。 这 从 技术 上 来 说 是 正确 的 ， 然 而 用 处 不 大 。 

最 后 ， 对 于 setuid 和 setgid 程 序 是 禁用 MALLOC_CHECK 的， 因为 怀 有 恶意 的 人 可 以 利用 这 种 功 
能 组 合 进行 安全 攻击 。 可 以 通过 创建 文件 /etc/suid-debue 来 重新 启用 。 这 个 文件 的 内 容 不 重要 ， 重 
要 的 是 存在 这 个 文件 。 

总 而 言 之 ，MALLOC_CHECK_ 是 一 种 方便 的 工具 ， 在 代 人 码 开 发 期 间 用 来 捕获 与 堆 相 关 的 编程 故 
障 。 然 而 ， 如 果 怀 疑 有 DAM 问 题 ， 或 者 要 仔细 扫描 代码 查找 可 能 存在 的 DAM 问 题 ， 束 应 当 使 用 

另 一 个 实用 工具 。 

2. 使 用 mcheck() 工 具 

除 MALLOC_CHECK 外 还 可 以 用 mcheck() 工 具 。 我 们 发 现 这 个 方法 比 MALLOC_CHECK 更 令 人 满 
Feo mcheck() Bm 78 A: 



































#include «mcheck.h» 
int mcheck (void (*ABORTHANDLER) (enum mcheck status STATUS)) 


在 调用 任何 与 堆 相 关 的 函数 前 必须 调用 mcheck()， 盏 则 对 mcheck() 的 调用 会 失败 。 因 此 ， 应 
当 在 程序 中 非常 早 的 时 候 调 用 这 个 冰 数 。 一 旦 成 功 调 用 mcheck() 束 会 返回 9， 如 果 调 用 得 太 述 则 
会 返回 -1。 

检测 到 DAM 中 的 不 一 致 时 会 调用 用 户 提 供 的 函数 ， 参 数 *ABORTHANDLER 是 指 癌 这 个 函数 的 指 
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针 。 如 果 将 NULL 传 递 给 mcheck()， 则 使 用 上 默认 处 理 程序 。 与 MALLOC_CHECK 一 样 ， 这 个 默认 处 理 
程序 也 问 stdout 输 出 一 条 错误 消息 , 并 调用 abort() 来 产生 核心 文件 ,与 MALLOC_CHECK 不 同 的 是 ， 
这 条 错误 消息 是 有 用 的 。 例 如 ， 在 代码 清单 7-10 中 ， 超 出 动态 分 配 的 段 的 末尾 。 


代码 清单 7-10 mcheckTest.c 








int main(void) 
i 
mcheck (NULL) ; 
int «p = (int *) malloc(sizeof(int)); 
p[1] = 0; 
free(p); 
return 0; 


| 
它 产 生 如 下 所 示 的 错误 消息 。 


$ gcc -g3 -Wall -std-c99 mcheckTest.c -o mcheckTest -lmcheck 
$ ./mcheckTest 

memory clobbered past end of allocated block 

Aborted (core dumped) 


HABA AY A) [n] RU 2S ELITS] TED PER T A e 

3. 使 用 mtrace() 捕 获 内 存 泄漏 和 重复 释放 

mtrace() 工 具 是 GNU C 库 的 一 部 分 ， 用 来 捕获 C 和 C++ 程序 中 的 内 存 刘 漏 和 重复 杰 放 。 
mtrace() 的 使 用 涉及 5 个 步骤 。 

(1) 将 环境 变量 MALLOC_TRACE 设 置 成 有 效 的 文件 名 。 这 是 mtrace() 在 其 中 放置 消息 的 文件 
名 。 如 条 没有 将 该 变量 设置 为 有 效 文件 名 ， 或 者 没有 设置 该 文件 的 写 权 限 ， 那 么 mtrace() 将 什 
么 也 不 做 。 

(2) 包括 mcheck.h 尖 文件 。 

(3) 在 程序 最 上 方 调 用 mtrace()。 其 原型 为 : 


#include «mcheck.h» 
void mtrace(void); 























(4) 运行 程序 。 如 果 检 测 到 任何 问题 , 会 用 一 种 非 人 类 可 读 的 形式 将 它们 记 到 MALLOC_TRACE 
所 指 回 的 文件 中 。 另 外 ， 为 了 安全 起 见 ，mtrace() 不 会 对 setuid 或 setgid 可 执行 文件 做 任何 事情 。 

(5) mtrace() 配 备 了 一 个 称 为 mtrace 的 Perl 脚 本 ， 用 来 分 析 日 志文 件 ， 并 将 其 内 容 显 示 为 人 类 
可 读 的 标准 输出 形式 。 

注意 ， 这 里 还 调用 muntrace() 来 停止 内 存 跟 蹊 ， 但 是 glibc 信 息 页 面 建议 不 要 使 用 这 个 调用 。 
也 可 能 对 程序 使 用 了 DAM 的 C 库 会 得 到 通知 , 只 有 当 main() 已 返回 或 进行 了 对 exit() 的 调用 后 程 
序 才 会 结束 。 在 发 生 这 件 事 之 前 ，C 库 为 程序 使 用 的 内 存 不 会 被 释放 。 在 该 内 存 释放 之 前 对 
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muntrace() 的 调用 可 能 导致 判断 错误 。 

看 一 个 徐 单 示例 。 代 码 清单 7-11 说 明 mtrace() 捕 获 到 了 这 两 个 问题 。 在 下 面 的 代码 中 ， 我 们 
一 下 没有 释放 第 6 行 上 p 指 问 的 内 存 ， 在 第 10 行 上 我 们 在 指针 q 上 调用 free()， 尽 管 它 没有 指 问 动 
态 分 配 的 内 存 。 


代码 清单 7-11  mtracel.c 











ı int main(void) 


» { 


3 int *p, *q; 


mtrace(); 


r Lint +} m 


at — 1 alla 
ü P= ALE *J tidis 


rfcizen 
VL Lottery 


10 free(q); 
H return O; 


BJ 
WEHMALLOC TRACE 变 量 后 编译 该 程序 并 运行 它 。 


$ gcc -g3 -Wall -Wextra -std-c99 -o mtrace1 mtrace1.c 
$ MALLOC TRACE-"./mtrace.log" ./mtrace1 

p points to 0x8049a58 

q points to 0x804968c 





如 果 看 一 下 mtrace./og 的 内 容 ， 会 发 现 它 根本 没有 意义 。 然 而， 运行 Perl 脚 本 mtrace() 产 生 了 
无 法 理解 的 输出 。 


$ cat mtrace.log 

- Start 

@ ./mtrace1: (mtrace+0x120)[0x80484d4] + 0x8049a58 0x4 
@ ./mtrace1: (mtrace+0x157)[0x804850b] - 0x804968c 
p@satan$ mtrace mtrace. log 

- 0x0804968c Free 3 was never alloc'd 0x804850b 


Memory not freed: 


Address Size Caller 
0x08049a58 Ox4 at Ox80484dA 


然而 ， 这 只 是 略 有 儿 助 ， 因 为 虽然 mtrace() 友 现 了 问题 ， 但 是 它 将 它们 报告 成 了 指针 地 址 。 
所 符 ，mtrace() 能 够 做 得 更 好 。mtrace() 脚 本 也 将 该 可 执行 文件 的 文件 名 作为 可 选 的 参数 。 使 用 
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这 个 选项 ， 得 到 了 行 写 以 及 相关 的 问题 。 


- 0x0804968c Free 3 was never alloc'd 
/ home/p/codeTests/mtrace1.c:15 


Address Size Caller 
0x08049a58 Ox4 at /home/p/codeTests/mtrace1.c:11 


现在 ， 这 正 是 我 们 想 看 到 的 信息 ! 

像 MALLOC_CHECK_ 和 mcheck() 实 用 程序 一 样 ，mtrace() 不 能 防止 程序 朋 泪 。 它 仅仅 是 检查 问 
题 。 如 果 程 序 朋 涡 , mtrace() 肯 定 会 有 一 部 分 输出 丢失 或 错乱 , 这 可 能 产生 令 人 迷惑 的 错误 报告 。 
处 理 这 种 情况 的 最 佳 办 法 是 捕获 并 处 理 段 错误 ， 以 便 让 mtrace() 优 雅 地 终止 。 代 人 码 清单 7-12 说 明 
了 如 何 做 这 件 事 。 


代码 清单 7-12  mtrace2.c 














void sigsegv handler(int signum); 


int main(void) 


1 


int xp; 


signal(SIGSEGV, sigsegv handler); 
mtrace(); 
p = (int x) malloc(sizeof(int)); 


raise(SIGSEGV); 
return 0; 


} 


void sigsegv handler(int signum) 

{ 
printf("Caught sigsegv: signal %d. Shutting down gracefully.\n", signum); 
muntrace(); 
abort(); 





} 
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对 其 他 语言 使 用 
GDB/DDD/Eclipse 








们 一 般 都 知道 GDB 和 DDD 是 C/C++ 程序 的 调试 器 ， 但 是 它们 也 可 以 用 于 其 他 语言 的 开 
发 。Eclipse 最 初 是 为 Java 开 发 设计 的 , 但 是 它 为 其 他 很 多 语言 提供 了 插件 。 本 章 将 介绍 
如 何 使 用 这 种 多 语言 能 力 。 

GDB/DDD/Eclipse 不 一 定 是 哪 种 特定 语言 的 “最 佳 ” 调 试 器 。 每 种 特定 的 语言 都 有 很 多 优秀 
调试 工具 可 用 。 然 而 我 们 要 指出 的 是 , 无 论 使 用 哪 种 语言 编写 程序 , AEP EC. C++, Java, Python, 
Perl 还 是 其 他 可 使 用 这 些 工 具 的 语言 /调试 器 ， 如 果 能 够 使 用 相同 的 调试 界面 ， 那 将 是 相当 棒 的 。 
DDD wid HT ATA -o 

LiPyton A) fill. Python fie FE 2&4 4 E145 — 7r fa] FE T OCA I i iat. TARE, 虽然 也 存在 很 多 
优秀 的 Python 特 有 的 GUI 调 试 器 和 IDE， 但 是 另 一 种 选择 是 使 用 DDD 作 为 Python 内 置 调试 右 的 界 
面 。 这 样 可 以 既 获 得 GUI 的 便利 ， 叉 仍然 使 用 进行 C/C++ 编码 时 熟悉 的 界面 (DDD)。 

这 些 工 具 的 多 语言 功能 是 如 何 实现 的 呢 ? 

O 虽然 GDB 最 初 是 作为 CC++ 的 调试 器 创建 的 ， 但 是 后 来 使 用 GNU 的 人 也 提供 了 一 敌 Java 

TRES: GOJ. 
口 DDD 本 身 不 是 调试 器 ， 而 是 GUI 可 以 通过 它 来 加 底层 调试 器 发 布 命令 。 对 于 C/C++， 该 底 
层 调 试 器 通常 是 GDB。 然 而 ，DDD 经 党 可 用 来 作为 其 他 语言 特有 的 调试 器 的 前 端 。 

O Eclipse 也 只 是 前 端 。 各 种 语言 的 插件 使 它 可 以 开发 与 调试 用 那些 语言 编写 的 代码 。 

本 章 将 概述 在 Java、Perl、Python 和 汇编 语言 中 用 这 些 工 具 进 行 调试 。 应 当 指 出 的 是 ， 在 各 
种 情况 下 ， 都 有 一 些 别 的 功能 是 这 里 没有 涉及 的 ， 我 们 建议 你 探索 你 在 使 用 的 语言 的 详细 信息 。 


8.1 Java 


以 一 个 操作 链表 的 应 用 程序 为 例 。 这 里 ， 类 Node 的 对 象 表示 数字 链表 中 的 节点 ， 以 键 值 升序 
排列 。 这 个 列表 本 身 是 类 LinkedList 的 对 象 。 测 试 程序 TestLL.java 从 命令 行 读 入 数字 ， 建 立 一 个 
由 这 些 数学 组 成 的 排序 列表 ， 然 后 输出 这 个 排序 列表 。 下 面 是 源 代码。 
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TestLL.java 


ho 


// usage: [java] TestLL list of test integers 
// simple example program; reads integers from the command line, 
// storing them in a linear linked list, maintaining ascending order, 


// and then prints out the final list to the screen 


public class TestLL 


a 1 
9 public static void main(String[] Args) { 
(0 int NumElements = Args. length; 
T LinkedList LL = new LinkedList(); 
T for (int I = 1; I <= NumElements; I++) { 
13 int Num; 
14 // do C's "atoi()', using parseInt() 
15 Num = Integer.parseInt(Args[I-1]); 
16 Node NN = new Node(Num); 
17 LL.Insert(NN); 
18 } 
19 System.out.println(" final sorted list:"); 
20 LL.PrintList(); 
2] } 
m) 
LinkedList.java 


// LinkedList.java, implementing an ordered linked list of integers 


public class LinkedList 


{ 
public static Node Head = null; 


public LinkedList() { 
Head - null; 


// inserts a node N into this list 
public void Insert(Node N) { 
if (Head == null) { 
Head = N; 
return; 
} 
if (N.Value < Head.Value) { 
N.Next = Head; 
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19 Head = 
20 return; 
21 } 
29 else if (Head.Next == null) { 
23 Head.Next = N; 
?4 return; 
25 } 
26 for (Node D = Head; D.Next != null; D = D.Next) { 
27 if (N.Value < D.Next.Value) { 
98 N.Next = D.Next ; 
2) D.Next - N; 
30 return; 
31 } 
32 } 
33 } 
34 
35 public static void PrintList() { 
36 if (Head == null) return; 
37 for (Node D - Head; D !- null; D - D.Next) 
38 System.out.println(D.Value); 
39 } 
40 } 
Node.java 


1 // Node.java, class for a node in an ordered linked list of integers 


nz 


s public class Node 

iog 

5 int Value; 

6 Node Next; // "pointer" to next item in list 


8 // constructor 

9 public Node(int V) { 
i0 Value = V; 

H Next = null; 


i o} 





该 代码 中 有 一 个 程序 错误 ， 让 我 们 试 着 找 出 这 个 错误 。 
8.1.1 直接 使 用 GDB 调 试 Java 


人 们 一 般 将 Java 看 作 一 种 解释 语言 ， 但 是 使 用 GNU 的 GCJ 编 译 器 ， 可 以 将 Java 源 代码 编 详 为 
本 地 机 需 代 码 。 这 样 可 以 使 Java 应 用 程序 运行 得 快 得 多 , 这 也 意味 看 可 以 使 用 GDB 进 行 调 试 。( 确 
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保 使 用 GDB 5.1 或 者 更 高 的 版 本 。) GDB 本 号 或 者 通过 DDD， 比 JBD (Java Development Kit 配 套 的 
Vines) 功能 更 强大 。 例 如 ，JDB 不 允许 设置 条 件 断 后 ， 而 前 面 介绍 过 ， 这 是 一 种 基本 GDB 调 试 
技术 。 因 此 不 仅 可 以 少 学 一 人 m noi 天 得 更 好 的 功能 性 。 

首先 将 应 用 程序 编 详 成 本 地 机 喜 

$ gcj -c -g Node. java 


$ gcj -c -g LinkedList. java 
$ gcj -g --main=TestLL TestLL.java Node.o LinkedList.o -o TestLL 








这 几 行 代码 类 似 于 普通 GCC 命令 ， 除 了 -main=TestLL 选 项 外 ， 它 指定 函数 main() 将 作为 程序 
执行 入 口 点 的 类 。【〔 我 们 一 次 编译 两 个 源 文件 。 我 们 发 现 ， 为 了 人 确保 GDB 正 确 地 跟踪 源 文件 ， 这 
是 必需 的 。) 针对 测试 输入 运行 程序 后 得 到 如 下 结 


$ TestLL 8 5 12 
final sorted list: 








5 
8 


不 知 什么 原因 ,输入 的 12 消 失 了 。 让 我 们 来 看 如 何 使 用 GDB 来 查找 这 个 程序 错误 。 像 惯 第 一 
样 局 动 GDB， 首 和 完 告诉 它 ， 当 Java 的 无 用 单元 收集 操作 产生 Unix 信 号 时 ， 不 要 集 止 或 向 屏 大 输出 
公告 。 这 种 动作 是 一 种 干扰 ， 可 能 干扰 使 用 GDB 单 步调 试 的 能 力 。 


(gdb) handle SIGPWR nostop noprint 





Signal Stop Print Pass to program Description 

SIGPWR No No Yes Power fail/restart 
(gdb) handle SIGXCPU nostop noprint 

Signal Stop Print Pass to program Description 

SIGXCPU No No Yes CPU time limit exceeded 





现在 ,既然 第 一 个 明显 的 程序 错误 是 输入 中 的 数学 12， 那么 让 我 们 在 Insert() 方 法 开头 设置 
一 个 断 点 ， 这 个 市 后 键 值 上 的 条 件 等 于 12。 


(gdb) b LinkedList.java:13 if N.Value == 12 
Breakpoint 1 at Ox8048bb4: file LinkedList.java, line 13. 


另外 ， 也 可 以 尝试 如 下 命令 : 


(gdb) b LinkedList.java:Insert if N.Value -- 12 


然而 ， 虽 然 这 在 以 后 会 起 作用 ， 但 这 时 还 没有 加 载 LinkedList 关 。 
现在 在 GDB 中 运行 程序 : 


(gdb) r 8 5 12 
Starting program: /debug/TestLL 8 5 12 
[Thread debugging using libthread db enabled] 
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[New Thread -1208596160 (LWP 12846)] 
[New Thread -1210696800 (LWP 12876)] 
[Switching to Thread -1208596160 (LWP 12846)] 


Breakpoint 1, LinkedList.Insert(Node) (this=@47da8, N-011a610) 
at LinkedList.java:13 

13 if (Head == null) { 

Current language: auto; currently java 


根据 确认 原则 ， 让 我 们 确认 要 插入 的 值 为 12。 
(gdb) p N.Value 


$1 - 12 

SE EE AI. 

(gdb) n 

17 if (N.Value < Head.Value) { 

(gdb) n 

22 else if (Head.Next == null) { 

(gdb) n 

26 for (Node D = Head; D.Next !- null; D = D.Next) { 
(gdb) n 

27 if (N.Value < D.Next.Value) { 

(gdb) p D.Next.Value 

$2 = 8 

(gdb) n 

26 for (Node D = Head; D.Next !- null; D = D.Next) { 
(gdb) n 

12 public void Insert(Node N) { 

(gdb) n 

33 } 

(gdb) n 

TestLL.main(java.lang.String[]) (Args=@ab480) at TestLL.java:12 
12 for (int I = 1; I <= NumElements; I++) { 

这 不 好 。 我 们 过 历 了 所 有 Insert()， 而 没有 插入 12。 

再 仔细 一 点 查看 ， 你 将 发 现在 LinkedList.java 中 第 26 行 开始 的 循环 ， 我 们 将 要 插入 的 值 12 与 





列表 中 目前 的 两 个 值 5 和 8 相 比 较 ， 发 现在 这 两 种 情况 下 狐 值 较 大 。 这 实际 上 束 古 错误 所 在 。 我 们 
没有 处 理 在 其 中 要 插入 的 值 大 于 列表 中 所 有 已 存在 的 值 的 情况 。 所 以 需要 在 第 31 行 后 面 添加 代码 
来 处 理 这 种 情况 。 
else if (D.Next.Next == null) { 
D.Next.Next - N; 


return; 


} 
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纠正 后 ， 可 以 发 现 程 序 工作 正常 了 。 
8.1.2 ”使 用 DDD 与 GDB 调 试 Java 

如 果 使 用 DDD 作 为 GDB 的 界面 ， 那 么 这 些 步 又 会 容易 得 多 ， 也 更 令 人 愉快 (同样 假定 源 代 
人 码 是 用 GCJ 编 译 的 )。 像 惯常 一 样 启 动 DDD。 

$ ddd TestLL 

(忽略 关于 临时 文件 的 错误 消息 。) 

源 代码 没有 立即 出 现在 DDD 的 源 文本 窗口 中 ， 因 此 可 以 首先 使 用 DDD 的 控制 台 。 


(gdb) handle SIGPWR nostop noprint 

(gdb) handle SIGXCPU nostop noprint 

(gdb) b LinkedList.java:13 

Breakpoint 1 at 0x8048b80: file LinkedList.java, line 13. 
(gdb) cond 1 N.Value -- 12 

(gdb) r 8 5 12 


这 时 源 代 但 出 现 了 ， 当 前 正 位 于 断 点 上 。 然 后 可 以 像 惯 单一 样 继续 进行 DDD 操 作 。 
8.1.3 使 用 DDD 作 为 JDB 的 GUI 
DDD 可 以 直接 与 Java Development Kit 的 JDB 调 试 占 结合 起 来 使 用 。 如 下 命令 : 








$ ddd -jdb TestLL.java 


会 月 动 DDD， 然 后 DDD 调 用 JDB。 
然而 ， 我 们 发 现 它 变 得 很 麻烦 ， 因 此 不 建议 采用 DDD 的 这 种 用 法 。 


8.1.4 用 Eclipse 调试 Java 


如 果 最 切 下 载 并 安装 的 是 Eclipse 的 适用 C/C++ 开发 版 本 ， 则 需要 获取 JDT (Java Development 
Tools) 插件 。 

基本 操作 与 前 面 描述 C/C++ 时 一 样 ， 但 是 要 注意 如 下 几 点 。 

a 当 创 建 项 目 时 , 确保 选择 Java Project. 另外 , 建议 选中 Use Project Folder As Root for Sources 
and Classes 复 选 框 。 

O 使 用 导航 器 的 Package Explorer 视 图 。 

O 一 旦 保存 (或 导入 )， 源 文件 束 会 刻 编 译 成 .class。 

a 当 创 建 运行 对 话 框 时 ， 右 击 Java Application 并 选择 New。 在 标 为 Main Class 的 空格 中 ， 填 
宛 在 其 中 定义 main() 的 类 。 

a 当 创 建 调试 对 话 框 时 ， 选 中 Stop in Main 复 选 框 。 

O 在 调试 运行 中 ，Eclipse 会 在 main() 之 前 停止 。 只 要 单 击 Resume 投 钮 珑 可 以 继续 。 

图 8-1 显 示 了 Eclipse 中 的 一 个 典型 Java 调 试 场景 。 注 意 ， 与 CUC++ 一 样 ， 按 下 N 劳 边 的 下 三 角 
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形 ， 在 Variables 视 图 中 会 显示 节点 N 的 值 。 


v debug TestLL/LinkedList.java - Eclipse Platform 
File Edit Navigate Search Project Run Window Help 
| E &| B | O- @ |@ g |g Fe © Ge o- 





Me c5 
v [3]TestLL [Java Application] 
v GP TestLL at localhost:40734 > i LinkedList (id=18) 
"v af Thread [main] (Suspended) Node (id=24) 
LinkedList.Insert(Node) line: 25 
= TestLL.main(String[)) line: 17 
喝 /opt/jre1.6/bin/java (Dec 29, 2007 10:50:13 PM) 





四 TestLL.java 


Head = N; warwrtkerxwt =” 


return; 
) vV © LinkedList 
else if (Head.Next == null) { o *Head : Node 


Head.Next - N; 
return; © ^ LinkedList() 








Insert(Node) 


} 
for (Node D = Head; D.Next != null; D=D.Next) { : 
if (N.Value « D.Next.Value) { 9 "PrintList) 
N.Next - D.Next; 
D.Next - N; 
return; 








K|8-1 Eclipse 中 的 Java 调 试 
8.2 Perl 
我 们 将 使 用 下 面 的 示例 textcount.pI!， 它 计算 文本 文件 上 的 统计 信息 。 





1! #! /usr/bin/perl 


nz 


» # reads the text file given on the command line, and counts words, 
1 8 lines, and paragraphs 


&  open(INFILE,GARGV[0]); 


s $line count = 0; 
o $word count = 0; 
i $par count = 0; 


i2?  $now in par = 0; # not inside a paragraph right now 


4 while ($line = «INFILE») 1 


15 $line counter; 
16 if ($line ne "\n") { 
17 if ($now in par == 0) { 
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18 $par count++; 

19 $now in par - 1; 

20 } 

21 @words on this line = split(" ",$line); 

29 $word count += scalar(@words on this line); 
23 } 

24 else { 

25 $now in par = 0; 

26 } 

27 } 


ə print "$word count $line count $par_count\n"; 


该 程序 统计 在 命令 行 上 指定 文件 中 的 单词 、 行 和 段落 数量 。 作 为 测试 用 例 ， 我 们 使 用 如 下 所 
示 的 文件 festat《〈 你 可 能 筑 得 似曾相识 ， 诛 来 它 征 本 书 第 1 章 中 的 内 容 )。 








In this chapter we set out some basic principles of debugging, both 
general and also with regard to the GDB and DDD debuggers. At least one 
of our rules’ will be formal in nature, The Fundamental Principle of 
Debugging. 


Beginners should of course read this chapter carefully, since the 
material here will be used throughout the remainder of the book. 


Professionals may be tempted to skip the chapter. We suggest, though, 
that they at least skim through it. Many professionals will find at 
least some new material, and in any case it is important that all 
readers begin with a common background. 


EREA 2A, Debugging WI PA4T, ProfessionalsBi IA —41 « 4EXXh X 4r E3811 
我 们 的 Perl 代 码 后 得 到 的 得 出 应 如 下 所 示 。 


$ perl textcount.pl test.txt 








102 14 3 
ME, RERI Sw Jelse fij. 
else { 
$now in par = 0; 
j 
\end{Code} 


The output would then be 


\begin{Code} 
$ perl textcount.pl test.txt 





图 灵 社 区 会 员 cindy282694 GS 尊重 版 权 


8.2.1 


204 第 8 


102 14 1 


XE 


X 


对 其 他 语言 使 用 GDB/DDD/Eclipse 


单词 数量 和 行 数 是 正确 的 ， 但 段落 数 是 错误 的 。 


通过 DDD 调 试 Perl 
Perl 有 它 自己 的 内 置 调试 器 ， 这 个 调试 器 通过 命令 行 上 的 -d 选 项 调用 。 


$ perl -d myprog.pl 


这 个 内 置 调试 器 的 一 个 缺陷 是 它 没 有 GUI， 但 是 通过 DDD 运 行 调 试 器 可 以 弥补 这 一 缺陷 。 让 
我 们 看 看 可 以 如 何 使 用 DDD 查 找 程 序 错 误 。 刍 入 如 下 代码 来 调用 DDD: 


$ ddd textcount.pl 


DDD H ZntE 
表示 当前 的 位 置 。 
Hl E XE XT FF. Program > Run 来 指定 命令 行 参 数 test.txt， 并 填充 弹出 窗口 的 Run with 
Arguments 部 分 ， 如 图 8-2 所 示 。( 在 DDD 控 制 台 上 可 能 会 发 现 “...do not know how to create a new 
TTY...” 这 样 的 消息 ， 和 忽略 它 。) 另外 ， 可 以 通过 在 DDD 控 制 台 中 简单 地 键入 如 下 Perl 调 试 命令 
来 “手工 ”设置 参数 : 


IE, 
AS 


| 这 是 Perl 肢 本 ， 调 用 Perl 调 试 右 ， 并 在 第 一 行 可 执行 代码 上 设置 绿色 的 篆 





@ARGV[O] = "test.txt" 





DDD: /home/nm/Debug/Book/textcount. pl 


#! /usr/bin/per1l 


# reads the text file given on the command line, and counts words, 


f lines, and paragraphs 


open(CINFILE,GARGV [0]) ; 
X DDD: Run Program 
$l1ine count = 0; 
$word count = 0; 
$par count - 0; 


$now in par = 0; # not insid 
while ($line = «INFILE») 1 
$1ine_count++; 
if ($line ne "\n") { 
if ($now in par == 0) 
$par_count++; 
$now_in_par = 1; 


Qwords on this line = s 
$word count += scalar( 


else ( 
$now in par = 0; 


} 


print "$word count $line count $par_count\n"; 


Editor support available. 


Enter h or ^h h' for help, or “man perldebug' for more help. 


DB<> 
" 





图 8-2 ”设置 命令 行 参 数 
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由 于 错误 在 于 段落 数量 中 ， 因 此 让 我 们 看 看 当 程 序 达 到 第 一 段 末 尾 时 发 生 了 什么 事 。 这 会 在 
ll PATE EC Je ARA 


$words on this line[O] eq "Debugging." 


让 我 们 在 while 循 环 开头 附近 放置 一 个 断 点 。 我 们 这 样 做 的 方式 与 前 面 见 过 的 用 于 C/C++ 程 
序 的 方式 完全 相同 ， 通 过 右 击 这 一 行 ， 选 择 Set Breakpoint。 

还 应 在 这 个 断 点 上 加 上 上 面 的 条 件 。 同 样 ， 单 击 Source 一 Breakpoints， 硝 傈 突出 显示 
Breakpoints and Watchpoints 弹 出 窗口 中 的 给 定 断 点 ， 然 后 单 击 Props 图 标 。 之 后 填充 所 需 的 条 件 ， 
见 图 8-3。 

















DDD: Jhome/nmpDebug/Book/textcount.pl 


$par_count++; 
$now_in_par = 1; 


} 
Qwords. on this line = split" 
$word count += scalar(Gwords o 


} 
else { 
$now_in_par = 0; 


} 


print "$word_count $1ine count $par_ 


by typing tty, and disconnect the shell from TTY by sleep 1000000. 
[6525-»26525]DB«- b 16 
[6525-26525]DB«» 


j 








图 8-3 ZEB EU HIT 


选择 Program 一 Run。( 我 们 不 选择 Run Again， 因 为 这 似乎 把 人 市 到 了 Per 内 部 。) 我 们 将 鼠标 
移 到 使 它 指向 变量 gwords_on_this_line 的 实例 ，DDD 会 照常 弹出 黄色 框 显 示 该 变量 的 值 。 因 此 
我 们 确认 断 点 条 件 满足 ， 见 匈 8-4。 

当 按 下 Next 儿 次 来 跳 过 文本 文件 中 的 空白 行 后 ， 你 将 注意 到 我 们 也 跳 过 了 下 面 这 行 。 























$par count; 


我 们 原来 预期 使 用 上 面 这 行 代码 递增 段落 数 。 回 尖 来 看 ， 这 是 由 于 变量 $now_in_par 为 0 引起 
的 ， 通 过 观察 ， 很 快 可 以 明白 如 何 修 复 这 一 程序 错误 。 
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DDD: /home/nm/Debug/Book/textcount. pl 


Bwords. on. this, lin& 39 
#! /usr/bin/perl 


f reads the text file given on the command line, and counts words, 
# lines, and paragraphs 


open(CINFILE, GARGV [0] ) ; 
$line count - 0; 

$word count - 0; 

$par. count = 0; 


$now in par = 0; # not inside a paragraph right now 





while ($line = «INFILE») { 
$1ine_count++; 
if ($line ne "An"» 4 
if ($now in par 220) ( 
$par_count++; 
$now_in_par = 1; 


F 
Qwords on this line = split(" ",$line); 
$word count += scal[t*Debugging. "5|! s-11ne5; 
$ 
else { 
$now in par = 0; 


} 


J 


print "$word count $1ine count $par_count\n"; 


by typing tty, and disconnect the shell from TTY by sleep 1000000. 


[6525-26525-»6525]DB«» c 
[6525-»6525—»6525]DB«» 





K]8-A 到 达 断 点 时 的 情况 


在 DDD 中 , 也 可 以 通过 选择 Source 一 Breakpoints， 突 出 显示 断 点 ， 然 后 单 击 所 需 选 项 来 禁用 、 
局 用 或 删除 断 点 。 
如 果 修 改 了 源 文件 ， 则 必须 通知 DDD 通 过 选择 File 一 Restart 来 更 新 其 自身 。 


8.2.2 ”在 Eclipse 中 调试 Perl 


为 了 在 Eclipse 中 开发 Perl 代 码 , 我 们 需要 PadWalker Perl 软 件 包 (可 以 从 CPAN 下 载 )， 以 及 Perl 
的 EPIC Eclipse 插件 。 

同样 ， 基 本 操作 与 以 前 对 C/C++ 的 摘 述 相同 ， 但 是 注意 以 下 儿 点 。 

O 创建 项 目 时 ， 选 择 Perl Project. 

a 使 用 Navigator 作 为 导航 器 视图 。 

O 没有 构建 阶段 ， 因 为 Perl 不 产生 字 节 码 。 

a 在 Debug 透 视图 中 ， 只 能 在 Variables 视 图 中 访问 变量 的 值 ， 而 不 能 通过 在 源 代 人 码 视图 中 的 

忌 标 动作 来 访问 ， 而 且 只 能 访问 局 部 变量 。 

需要 在 源 代 码 中 各 个 变量 的 第 一 个 实例 中 使 用 Perl 的 my 关键 字 来 查看 全 局 变量 〈 这 时 会 用 到 
PadWalker £4, )。 

Kl8-5 zs SAS HU Perl i ibe Ae TERR BR 18] ee PS my ES o 


























图 灵 社区 会 员 cindy282694 GS 尊重 版 权 


8.3 Python 207 


v debug - textcount/textcount.pl - Eclipse Platform 


File Edit Source Refactor Navigate Search Project Run Window Help 
j&|gp|*-0-Q-|S 9| 4/8 § 











Y Ytextcount [Perl Local] 
v i$ Per Debugger Q- $line count 
"v 只 «suspended» Main Thread 
= textcount.pl[line: 9] 


»5 Perl Debugger 





# inputs the text file given on the command line, and counts words, 
# lines and paragraphs 


open(INFILE ,@ARGV[0]); 

my $line_count = 0; 

my $word_count = 0; 

my $par count = 0; 

my $now in par = 0; # not inside a paragraph right now 


mhila (Pismo — zZTMPTTT«^ f 











Kl8-5 Perl 调试 屏幕 


8.3 Python 
与 上 面 的 Perl 示 例 一 样 ， 让 我 们 以 #fpy 为 例 ， 统 计 文本 文件 中 的 单词 数量 、 行 数 和 上 段落 数量 。 





i class textfile: 

ntfiles = 0 # count of number of textfile objects 
à def init (self,fname): 

1 textfile.ntfiles += 1 

z self.name = fname # name 

6 self.fh = open(fname) 

7 self.nlines = O # number of lines 


ML 


8 self.nwords = 0 # number of words 
9 self.npars = O # number of words 
10 self.lines = self.fh.readlines() 

T self.wordlineparcount() 

|? def wordlineparcount(self): 


E "finds the number of lines and words in the file" 
T self.nlines - len(self.lines) 

I5 inparagraph = O 

6 for l in self.lines: 

i7 w = l.split() 
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18 self.nwords += len(w) 
19 if 1 == "\n: 

20 if inparagraph: 

21 inparagraph = 0 
99 elif not inparagraph: 
23 self.npars += 1 

24 inparagraph = 1 


26 def grep(self,target): 





27 “prints out all lines in the file containing target” 
28 for 1 in self.lines: 
29 if l.find(target) >= 0: 
30 print 1 
TT print i 
32 
» def main(): 
84 t = textfile('test.txt') 
35 print t.nwords, t.nlines, t.npars 
36 
3 if name == ' main ' 
38 main() 
一 定 要 在 源 代码 程序 末尾 包括 如 下 所 示 的 两 行 代码 。 
if name ==‘ main ': 
main() 


说 明 如果 你 是 经 验 丰 富 的 Python 程序 员 ， 很 可 能 了 解 这 个 模式 。 如 果 你 不 熟悉 Python， 那 么 我 解释 
一 下 ， 这 几 行 代码 是 需要 测试 Python 程序 是 本 身 被 调用 来 还 是 被 作为 模块 导入 到 了 其 他 某 个 
程序 中 。 这 是 通过 调试 器 运行 程序 时 产生 的 一 个 问题 。 


8.3.1 在 DDD 中 调试 Python 


Python 的 基本 调试 器 是 PDB (pqb.py)， 这 是 一 个 基于 文本 的 工具 。 它 的 实用 性 通过 使 用 DDD 
作为 GUI 前 站 而 得 到 大 大 增强 。 

然而 在 开始 前 要 先 关 注 几 个 问题 。 为 了 使 DDD 正 确 地 访问 PDB，Richard Wolff 编 写 了 PYDB 
(pydb.py)， 这 是 对 PDB 临 微 修 改 后 的 版 本 。 然 后 用 -pydb 选 项 运行 DDD。 但 是 随 看 Python 的 演变 ， 
原来 的 PYDB 不 再 能 正确 地 工作 。 

一 个 好 的 解决 方案 羡 Rocky Bernstein 开 有 的 。 在 编号 本 书 时 《2007 年 夏天 )， 据 说 他 的 修改 
后 的 PYDB 有 了 很 大 扩展 ， 将 包括 到 DDD 的 下 一 个 版本 中 。 另 外 ， 可 以 使 用 Richard Wolff 捉 供 的 
补丁 。 需 要 的 文件 如 下 : 

O Attp://heather.cs.ucdavis.edu/matloff/Python/DDD/pydb.py 
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O Attp://heather.cs.ucdavis.edu/matloff/Python/DDD/pydbcmd.py 

QO Attp://heather.cs.ucdavis.edu/ matloff/Python/DDD/pydbsupt.py 

将 这 些 文件 放 在 某 个 目录 中 , 假设 是 /usr/bin， 为 它们 赋予 执行 权限 ， 并 创建 一 个 由 下 和 面 这 行 
代码 组 成 的 文件 ， 命 名 为 pydb: 

/usr/bin/pydb.py 

一 定 也 要 赋 子 pydp 执 行 权 限 。 完 成 这 件 事后 就 可 以 将 DDD 用 于 Python 程序 ， 然 后 激活 PDDD: 


$ ddd --pydb 











说 明 ”如果 弹 出 一 个 错误 窗口 ， 表 明 “PYDB 不 能 尼 动 >， 可 能 是 因为 路 径 问 题 。 例 如 ， 可 能 有 另 一 
个 名 为 pydb 的 文件 。 只 要 确保 在 搜索 路 径 中 DDD 的 该 文件 是 第 一 个 遇 到 的 文件 。 


然后 打开 源 文件 tfpy， 可 以 通过 选择 File 一 Open Source 并 双击 文件 名 ， 也 可 以 通过 在 控制 台 
中 键入 如 下 代码 : 


file tf.py 


(Pdb) 提示 符 最 初 可 能 不 会 显示 ， 但 是 无 论 如 何 都 要 键入 你 的 命令 。 

源 代码 会 出 现在 源 文 本 窗口 中 , 然后 可 以 像 惯 津 一 样 设置 断 点 。 假设 在 如 下 这 行 代 人 码 上 设置 
了 一 个 断 点 : 

w = l.split() 


为 了 运行 程序 ， 单 击 Progr am 一 Run， 在 Run 弹 出 窗口 中 设置 任何 命令 行 参数 ， 然 后 单 击 Run。 
在 蛙 击 Run 按 钮 后 ， 需 要 单 击 Continue 两 次 。 这 是 因为 搬 层 PDB/PYDB 调 试 器 的 工作 机 理 。( 如 末 
忘记 了 做 这 件 事 ，PDB/PYDB 会 在 DDD 控 制 台中 提醒 你 。) 
要 对 源 代码 进 行 修 改 ， 则 在 控制 台中 执行 file 命 令 ， 或 者 选择 Source 一 Reload Sources EK 
运行 的 断 点 会 你 留 。 
8.3.2 ”在 Eclipse 中 调试 Python 
再 次 ，Python 的 过 程 类 似 于 其 他 语言 。 这 当然 说 明了 让 同一 个 工具 适用 于 多 种 语言 的 价值 。 
一 是 学 会 了 如 何在 一 种 语言 中 使 用 某 种 工具 ， 就 很 容易 为 另 一 种 语言 使 用 这 种 工具 。 关 于 Python 
特有 的 要 点 需 记 住 如 下 内 容 。 
O 需要 安装 Pydev 搬 件 。 安 装 后 ,选择 Window 一 Preferences 一 Pydev， 并 将 Python 解释 器 的 位 
‘a. Cbüusr/bin/python) 通知 Eclipse。 
O 使 用 Pydev Package Explorer 作 为 导航 器 透视 图 。 
a 因为 没有 创建 永久 学 市 码 文件 ， 所 以 没有 构建 过 程 。 
a 在 建立 运行 /调试 对 话 框 时 ， 注 意 如 下 内 容 : 用 和布 望 从 中 开始 执行 的 源 文件 名 项 元 Main 
Module。 在 Arguments 选 项 卡 中 ， 在 Base Directory 中 填充 具有 输入 文件 的 目录 (或 者 这 些 
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目录 树 的 根 目 录 )， 并 将 命令 行 参 数 放 在 Program Arguments 中 。 
O 在 Debug 透 视图 中 ， 变 量 的 值 只 能 通过 Variables 视 图 访问 ， 而 且 仅 限于 访问 局 部 变量 。 
Eclipse 优 于 DDD 的 一 个 主要 优点 是 ，DDD 使 用 的 底层 调试 引擎 PDB 不 适用 于 多 线程 程序 ， 
而 Eclipse 适用 于 这 种 程序 。 


8.4 调试 SWIG 代码 


SWIG (Simplified Wrapper and Interface Generator) 是 一 种 流行 的 开源 工具 , 用 来 将 Java、Perl、 
Python 和 才干 其 他 解释 语言 与 CC++ 接 合 。 大 部 分 Linux 发 行 版 都 包括 SWIG， 也 可 以 从 网 上 下 载 。 
它 允 许 使 用 解释 语言 编写 应 用 程序 的 大 部 分 代码 ， 并 与 程序 员 用 C/C++ 编写 的 特定 部 分 结合 ， 从 
而 增强 性 能 。 

问题 在 于 如 何在 这 样 的 代码 上 运行 GDB/DDD。 下 徊 我 们 将 提供 一 个 使 用 Python 和 C 的 小 示 
例 。C 代 码 将 定理 一 个 先进 先 出 (FIFO〉》 队 列 。 


i // fifo.c, SWIG example; manages a FIFO queue of characters 












































[Evi 


s char *fifo; // the queue 


int nfifo = 0, // current length of the queue 
6 maxfifo; // max length of the queue 


s int fifoinit(int spfifo) // allocate space for a max of spfifo elements 
o { fifo = malloc(spfifo); 
10 if (fifo == 0) return 0; // failure 


11 else 1 

E maxfifo - spfifo; 

13 return 1; // success 
id } 

5 oj 


5; int fifoput(char c) // append c to queue 
is ( if (nfifo < maxfifo) 1 

19 fifo[nfifo | = C; 

20 return 1; // success 

21 } 


99 else return 0; // failure 


» ) 
24 

s char fifoget() // delete head of queue and return 
o { char c; 

27 if (nfifo > 0) { 

98 c = fifo[0]; 


39 memmove ( fifo,fifo«1,--nfifo); 
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30 return C; 

31 } 

32 else return 0; // assume no null characters ever in queue 
as] 





除了 .c 文 件 外 ，SWIG 还 需要 一 个 接口 文件 ， 在 本 例 中 是 fifo.i。 访 文件 由 全 局 符号 组 成 ， 用 
SWIG 样 式 列 出 一 次 ， 用 C 样 式 列 出 一 次 。 
%module fifo 


“extern char «fifo; 

extern int nfifo, 
maxfifo; 

extern int fifoinit(int); 


extern char «fifo; 

extern int nfifo, 
maxfifo; 

extern int fifoinit(int); 

extern int fifoput(char); 

extern char fifoget(); 


为 了 编译 该 代码 ， 先 运行 swig， 它 产生 一 个 额外 的 .ce 文 件 和 一 个 Python 文件 。 然 后 使 用 GCC 
和 1d 产 生 一 个 .so 共享 的 目标 动态 库 。 下 面 是 Make 文 件 。 


 fifo.so: fifo.o fifo wrap.o 
gcc -shared fifo.o fifo wrap.o -o fifo.so 








fifo.o fifo wrap.o:  fifo.c fifo wrap.c 
gcc -fPIC -g -c fifo.c fifo wrap.c -I/usr/include/python2.4 


fifo.py fifo wrap.c:  fifo.i 
swig -python fifo.i 


这 个 库 被 作为 一 个 模块 导入 Python， 如 下 面 的 测试 程序 中 所 示 。 


# testfifo.py 





import fifo 


def main(): 
fifo.fifoinit(100) 
fifo.fifoput('x') 
fifo.fifoput('c') 
c - fifo.fifoget() 
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print c 
c = fifo.fifoget() 
print c 
if name == ' main ': main() 


该 程序 的 输出 应 为 “x” 和 “c”， 但 是 我 们 发 现 输出 为 空 : 


$ python testfifo.py 


$ 
为 了 使 用 GDB, 记 住 你 在 运行 的 实际 程序 是 Python 解释 器 python。 因 此 在 该 解释 器 上 运行 GDB。 
$ gdb python 


ME, RITKE PS FIFO R RAAR TAR SPR A IMR. AL El] Python fie FE at 
执行 了 如 下 代码 才 会 发 生 加 载 : 

import fifo 

幸而 ， 我 们 可 以 要 求 GDB 在 库 中 的 某 个 函数 上 停止 : 


(gdb) b fifoput 
Function "fifoput" not defined. 
Make breakpoint pending on future shared library load? (y or [n]) y 











Breakpoint 1 (fifoput) pending. 


现在 运行 解释 器 ， 其 参数 为 测试 程序 testfifo.py。 


(gdb) r testfifo.py 

Starting program: /usr/bin/python testfifo.py 
Reading symbols from shared object read from target memory...(no debugging 
symbols found)...done. 

Loaded system supplied DSO at 0x164000 

(no debugging symbols found) 

(no debugging symbols found) 

(no debugging symbols found) 

[Thread debugging using libthread db enabled] 
[New Thread -1208383808 (LWP 15912)] 

(no debugging symbols found) 

(no debugging symbols found) 

(no debugging symbols found) 

(no debugging symbols found) 
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Breakpoint 2 at Ox3b25f8: file fifo.c, line 18. 
Pending breakpoint "fifoput" resolved 
[Switching to Thread -1208383808 (LWP 15912)] 


Breakpoint 2, fifoput (c-120 'x') at fifo.c:18 


18 { if (nfifo « maxfifo) { 
你 现在 可 以 做 已 经 非常 熟悉 的 事 : 
(gdb) n 

19 fifo[nfifo] = c; 
(gdb) p nfifo 

$1 0 

(gdb) c 

Continuing. 


Breakpoint 2, fifoput (c-99 'c') at fifo.c:18 


18 { if (nfifo « maxfifo) { 
(gdb) n 

19 fifo[nfifo] = c; 
(gdb) p nfifo 

32 50 








问题 就 在 这 里 。 每 次 试图 向 队列 中 添加 字符 时 ， 只 要 重 写 前 面 添加 的 字符 。 第 19 行 应 为 : 
fifo[nfifo++] = c; 
一 旦 进行 了 修改 ， 代 码 就 能 正确 工作 。 
汇编 语言 
GDB 和 DDD 在 调试 汇编 语言 代码 时 极其 有 用 。 本 节 将 摘 述 要 记 住 的 一 些 特殊 情况 。 
以 文件 testfs 中 的 代码 为 例 。 


ı 4 the subroutine findfirst(v,w,b) finds the first instance of a value v 
ə # in a block of w consecutive words of memory beginning at b, returning 
s 4 either the index of the word where v was found (0, 1, 2, ...) or -1 if 
1 8 v was not found; beginning with start, we have a short test of the 

5  €& subroutine 


7 „data # data segment 


8 Xt 
9 .long 1 
10 long 

n .long 3 
12 .long 168 
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这 是 Linux Intel 沪 编 语言 ， 使 用 的 是 AT&T 语 法 ,但 是 熟悉 其 他 Intel 语 法 的 用 户 应 当 友 现 该 代 
iy A Eb EH]. (GDB 命 令 set disassembly-flavor intel 5 $45 GDB 以 Intel 语 法 显示 其 
disassemble 命 令 的 所 有 和 输出， 这 类 似 于 NASM 编 译 器 所 使 用 的 语法 。 顺 便 提 及 ， 由 于 这 是 Linux 
平台 ， 因 此 程序 在 Intel CPU 的 32 位 平面 模式 下 运行 。) 


大 大 


„text 
.globl 


done: 
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.long 8888 
# code segment 
Start # required 


nn taken 
XP * LATS Sl GN 


# required to use this label unless s l n 
# push the arguments on the stack, then make the call 
push $x+4 # start search at the 5 
push $168 # search for 168 (deliberately out of order) 
push $4 # search 4 words 


call findfirst 


movl Zedi, “edi # dummy instruction for breakpoint 


findfirst: 


top: 


found: 


notthe 


# finds first instance of a specified value in a block of words 

EBX will contain the value to be searched for 

ECX will contain the number of words to be searched 

EAX will point to the current word to search 

return value (EAX) will be index of the word found (-1 if not found) 
fetch the arguments from the stack 

movl 4(%esp), %ebx 

movl 8(%esp), %ecx 


movl 12(%esp), “eax 


Hh otk dk dk H 


movl %eax, ^edx # save block start location 
# top of loop; compare the current word to the search value 

cmpl (%eax), %ebx 

jz found 

decl %ecx # decrement counter of number of words left to search 

jz notthere # if counter has reached 0, the search value isn't there 


addl $4, “eax # otherwise, go on to the next word 
jmp top 


subl %edx, “eax # get offset from start of block 

shrl $2, %eax # divide by 4, to convert from byte offset to index 
ret 

re: 

movl $-1, “eax 


ret 








EAMES, Pil FEFindfirst AA f£rB — 1 TRE YEE el Ee h BUR XE TH SR 1K 
出 现 处 。 该 子 例 程 的 返回 值 是 找到 该 值 的 单词 索引 (8,1,2,…)， 如 末 没 有 找到 ， 则 返回 -1。 





该 子 例 程 预期 参数 被 放 在 栈 上 ， 因 此 栈 在 输入 时 类 似 如 下 形式 : 
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address of the start of the block to be searched 要 搜索 块 开 始 处 的 地 址 
number of words in the block 块 中 的 单词 数量 
value to be searched 要 找 的 值 

return address 返回 地 址 


说 明 Intel 栈 向 下 延伸 ， 即 向 内 存 中 的 地 址 0 增长 。 地 址 较 小 的 单词 出 现在 图 中 较 下 方 。 








为 了 引入 可 以 使 用 GDB 会 找 的 一 个 程序 错误 , 我 们 故意 搅乱 “ 主 ” 程序 调用 序列 中 的 元 又 。 


push $x+4 # start search at the 5 
push $168 # search for 168 (deliberately out of order) 
push $4 # search 4 words 


调用 之 前 的 指令 则 应 当 是 : 


push $x+4 # start search at the 5 
push $4 # search 4 words 
push $168 # search for 168 


正如 在 编译 C/C++ 代码 时 将 -g 选 项 用 于 GDB/DDD 一 样 ， 这 里 在 汇编 层 上 使 用 -gstabs。 


$ as -a --gstabs -o testff.o testff.s 


eI AE Y —^ Hbi x frtestfo. FF BEES E T LA DR VI EA RO VALS BAN T 
BG T0 EA fs E te IOS ET i ORE n] BEA HS C f e 
然后 我 们 链接 : 


$ ld testff.o 


这 时 产生 了 一 个 可 执行 文件 ， 默 认 名 为 q.out。 
让 我 们 在 GDB 下 运行 该 代位 。 


(gdb) b done 

Breakpoint 1 at 0x8048085: file testff.s, line 18. 
(gdb) r 

Starting program: /debug/a.out 

Breakpoint 1, done () at testff.s:18 

18 movl %edi, “edi # dummy for breakpoint 
Current language: auto; currently asm 

(gdb) p $eax 

$1 = -1 


























RAB, n ERR eos S HAR SLE SES. EAH] P $eaxXEZREAXTEPIESS. (AXE, VATE 
TE SETTE -1, AeA TESS ER ACH TIE PKI [8.168 - 
VL Sate e PEPPY, BB TS Sees ae or SN te PE. AEC, LEE T WE E. 
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Bo NTA PAS BUI AB BEY Air Et BR o 


(gdb) b findfirst 
Breakpoint 2 at 0x8048087: file testff.s, line 25. 


(gdb) r 

The program being debugged has been started already. 

Start it from the beginning? (y or n) y 

Starting program: /debug/a.out 

Breakpoint 2, findfirst () at testff.s:25 

25 movl 4(Xesp), %ebx 

(gdb) x/4w $esp 

oxbtffd9a0: 0x08048085 Ox00000004  0x000000a8  0x080490b4 


这 个 栈 当然 是 内 存 的 一 部 分 。 因 此 要 检查 它 ， 必 须 使 用 GDB 中 检查 内 存 的 x 命 令 。 这 里 ， 我 
们 要 求 GDB 显 示 从 栈 指针 ESP 指 示 的 位 置 开 始 的 4 个 单词 〈 注 意 上 面 的 栈 图 显示 了 4 个 单词 )。x 命 
令 会 显 丰 内存， 以 便 增加 地 址 。 这 正 是 所 需要 的 ， 因 为 在 Intel 染 构 上 和 在 很 多 其 他 染 构 上 一 样 ， 
FRE ONK HI. 

从 上 和 面 显示 的 栈 图 中 可 以 看 到 第 一 个 单词 应 为 返回 地 址 。 有 多 种 方式 可 以 检查 这 一 预期 。 一 
种 方法 是 使 用 GDB 的 disassemble 命 令 ， 该 命令 列 出 了 汇编 语言 指令 〈 机 需 码 的 反问 翻译 ) 及 其 
地 址 。 单 步 进入 子 例 程 ， 然 后 可 以 检查 栈 上 第 一 个 单词 的 内 容 是 否 与 调用 后 函数 的 地 址 相 匹 配 。 

检 得 后 将 发 现 是 匹配 的 。 然 而 ， 第 二 个 数学 4 本 应 为 被 搜索 的 值 (168)， 而 实际 上 是 搜索 块 
的 大 小 “4)。 从 这 一 信息 可 以 很 快意 识 到 我 们 不 小 心 在 调用 前 交换 了 这 两 个 push 指 令 。 




















图 灵 社 区 会 员 cindy282694 EF 尊重 版 权 


最 前 冶 的 [T 类 电子 书 发 售 平 全 


电子 出 版 的 时 代 已 经 来 临 。 在 许多 出 版 界 同 行 还 在 狂 
驳 仿 得 的 时 候 ， 图 灵 社 区 已 经 采取 实际 行动 拥抱 这 个 
出 版 业 巨 变 。 作 为 国内 第 一 家 发 售 电子 图 书 的 全 类 出 
版 商 ， 图 灵 社 区 目前 为 读者 提供 两 种 DRM -free 的 阅读 
体验 : 在 线 阅读 和 PDF。 



































相 比 纸 质 书 ， 电 子 书 具 有 许多 明显 的 优势 。 它 不 仅 发 
布 快 ， 更 新 容易 ， 而 且 尽 可 能 采用 了 彩色 图 片 ( 即 使 
有 的 书 纸 质 版 是 黑白 印刷 的 ) 。 读 着 还 可 以 万 便 地 进 
(THR. SUMA. SS HIATT EN 














最 方便 的 开放 出 版 平 合 


图 灵 社 区 同 读 着 开放 在 线 写 作 功 能 ， 协 助 你 实现 目 出 
版 和 开源 出 版 的 梦想 。 利 用 “合集 功能 ， 你 就 能 联 
合 二 三 好 友 共 同 创 作 一 部 技术 参考 书 ， 以 免费 或 收费 
的 形式 提供 给 读 着 。 (收费 形式 须 经 过 图 灵 社 区 立项 
评审 。) 这 极 大 地 降低 了 出 版 的 门 柳 。 只 要 你 有 写作 
的 意愿 ， 图 灵 社 区 就 能 帮助 你 实现 这 个 梦想 。 成 熟 的 
书稿 ， 有 机 会 入 选 出 版 计划 ， 同 时 出 版 纸 质 书 。 























图 灵 社 区 引进 出 版 的 外 文 图 书 ， 都 将 在 立项 后 蕊 上 在 
侍 区 公布 。 如 末 你 有 意 翻译 哪 本 图 书 ， 欢 迎 你 来 社区 
申请 。 只 要 你 通过 试 译 的 考验 ， 即 可 签约 成 为 图 灵 的 
FA. MER, 要 想 成 功 地 完成 一 本 书 的 翻译 工作 ， 是 
需要 有 坚强 的 效力 的 。 


欢迎 加 入 


各 灵 储 区 


图 灵 社 区 进一步 把 传统 出 版 流程 导电 子 书 出 版 业务 
紧密 结合 ， 目 前 已 实现 作 译 者 网 上 交 稿 、 编 辑 网 上 
审 稿 、 按 章 发 布 的 电子 出 版 模式 。 这 种 新 的 出 版 模 
式 ， 我 们 称 之 为 “敏捷 出 版 ”， 筷 可 以 让 谈 着 以 较 
快 的 速度 了 解 到 国外 最 新 扩 术 图 书 的 内 容 ， 弥 补 以 
往 翻 译 版 技术 书 “ 出 版 妈 过 时 ”的 缺憾 。 同 时 ， 敏 
捷 出 版 使 得 作 、 译 、 编 、 读 的 交流 更 为 万 便 ， 可 以 
提前 销 灭 书稿 中 的 错误 ， 最 大 程度 地 保证 图 书 出 版 


的 质量 。 









































最 直接 的 读者 交流 平台 


在 图 灵 社 区 ， 你 可 以 十 分 方便 地 写作 文章 、 提 区 勘 
误 、 发 表 评论 ， 以 各 种 方式 与 作 译 背 、 纲 辑 人 员 和 
其 他 读者 进行 交流 互动 。 提 交 勘 误 还 能 够 获 赠 社区 
银子 o 

















fn] APES AST ERUIT. WOES PEXE 
等 多 种 活动 ， 顾 取 积 分 和 银子 ， 积 累 个 人 声望 。 
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